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Prologo 




La palabra algebra proviene del termino arabe yabr que significa “reduction” 
y aparece por primera vez en el tratado del matematico persa Muhammad ibn 
Musa al-Jwarizmi titulado Kitab al-yabr wa-l-muqabala (“Compendio de calculo 
por el metodo de completado y balanceado”) y dedicado especialmente a la 
solution de ecuaciones (lineales y cuadraticas). Es por ello que, a lo largo de la 
historia, el principal objetivo del Algebra haya sido la resolution de ecuaciones. 
Sin embargo, en el s. XIX comienza a aparecer una tematica transversal que 
se alimenta de problemas provenientes de la geometrfa, el analisis, la teorfa de 
numeros y por supuesto, la teorfa de ecuaciones, que desemboca en el estudio 
de estructuras matematicas abstractas conformando lo que hoy en dfa se conoce 
como algebra moderna. Este texto esta dedicado esencialmente al estudio de 
una de tales estructuras abstractas, los espacios vectoriales, dentro de lo que 
se conoce como algebra lineal , y en el que los sistemas de ecuaciones lineales 
juegan un papel central. 

La division tematica de este texto comprende los contenidos correspondientes 
a la asignatura de Algebra de los grados de ingenierfa de la Universidad de 
Castilla-La Mancha, en los que el autor imparte docencia desde hace anos, 
aunque el material que presentamos puede ser tambien una referenda util en 
carreras cientffico-tecnicas en las que es habitual una formation en algebra lineal, 
al constituir esta una herramienta matematica basica en numerosas disciplinas. 

En lo que se refiere a los contenidos del texto, habrfa que dividir el libro 
en dos partes: en los tres primeros temas que tratan sobre numeros comple- 
jos, matrices y determinantes y sistemas de ecuaciones lineales presentamos las 
herramientas esenciales que conforman el soporte basico del cual se nutren el 
resto de temas. Aunque es probable que el lector haya tenido contacto con estos 
conceptos en cursos anteriores, seguramente encontrara que el tratamiento de 
los mismos y la notation empleada no le son tan habituales. Sin embargo hemos 
de resaltar la importancia que supone entender y manejar apropiadamente el 
lenguaje matematico. Por ello hemos incluido en un primer apendice (apendi- 
ce A) una serie de conceptos generates en el que tratamos de familiarizar al 
lector con la notation y el uso de sentencias logicas de una forma intuitiva, a la 
vez que introducimos unas cuantas nociones de teorfa de conjuntos, funciones y 
estructuras algebraicas. El tratamiento en este apendice dista mucho de ser ma- 
tematicamente riguroso y solo pretende fijar algunas ideas basicas en el lector. 
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Aunque aparece al final del texto, recomendamos encarecidamente la lectura del 
mismo antes de abordar los demas temas. 

En una segunda parte, que comenzarfa con el tema 4, se desarrolla el material 
tfpico en un curso de algebra lineal: espacios vectoriales, aplicaciones lineales , 
diagonalizacion y espacios euclideos. Hemos incluido ademas un tema dedicado 
al estudio de ecuaciones lineales en diferencias y otro al espacio afm , con los 
que cubrimos los contenidos especificados en los descriptores de la asignatura 
para el primer curso de los nuevos grados de ingenierfa. 

En cada uno de los temas se pretende ofrecer al lector varias perspectivas de 
la materia. Asf, se ha proporcionando una relation de definiciones y resultados 
con un enfoque muy matematico, incluyendo una buena cantidad de demostra- 
ciones que pueden ser omitidas en cursos de corte mas tecnico, a la vez que 
hemos tratado de ilustrar estos resultados con numerosos ejemplos. Por otro 
lado, hemos incluido en cada tema alguna aplicacion relevante que pone de ma- 
nifiesto que el algebra no solo no es una disciplina abstracta, sino que por el 
contrario, sus herramientas juegan un papel destacado en diversas aplicaciones. 
Y ademas, teniendo en cuenta la realidad actual en la que los ordenadores estan 
cada vez mas presentes en todos los contextos, hemos tratado de ilustrar el uso 
del lenguaje de programacion Python para llevar a cabo buena parte de los 
calculos involucrados en cada uno de los temas. 

Es importante senalar que este no es un libro para aprender a programar 
en Python pues no hace un tratamiento profundo de una serie importante 
de caracterfsticas del lenguaje. No obstante, con las indicaciones incluidas en 
cada tema, creemos que el lector podra usar el lenguaje para el proposito que 
planteamos aqui, que no es mas que ayudar en los calculos, en ocasiones tediosos, 
que son necesarios realizar a lo largo del texto. En cualquier caso incluimos en un 
segundo apendice (apendice B) una breve introduction de los aspectos esenciales 
para el manejo de Python, de obligada lectura para los profanos en el lenguaje. 

Como en cualquier otra asignatura de matematicas, el aspecto esencial que 
se persigue es la adquisicion de destrezas mas que conocimientos, tal y como po¬ 
ne de manifiesto la cita con la que abrimos este texto: aprender matematicas es 
un proceso de aprender a hacer algo, no de adquirir conocimientos. Obviamente 
no debe interpretarse esto como una invitation a dejar de lado los contenidos 
teoricos de la asignatura, por otra parte imprescindibles. Pero es fundamental 
tener presente que el aprendizaje debe ir encaminado a la resolution 
de problemas. No es sino mediante los ejercicios como el lector podra poner 
a prueba el exito de su aprendizaje y es por ello que recomendamos encareci¬ 
damente que sea esa la labor central de su trabajo. El estudio de la teoria es 
simplemente una condition necesaria para poder resolver los problemas. 

En ese sentido hemos incluido en cada tema una section final con ejercicios 
de diversa naturaleza. Por una parte aparecen ejercicios de repaso con los 
que se pretende que el lector pueda comprobar la correcta adquisicion de 
conocimientos y herramientas basicas de cada tema. El apartado de problemas 
comprende ejercicios mas variados en los que se requiere ir un paso mas alia 
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que en los ejercicios de repaso, bien precisando del uso simultaneo de varios 
conceptos o de algunas tecnicas mas depuradas. Hay tambien un apartado 
dedicado a ejercicios tedricos de naturaleza mas matematica y con los que se 
persigue que el lector ponga en practica tecnicas similares a las aprendidas 
en las demostraciones de los resultados, y finalmente, hay un breve apartado de 
ejercicios adicionales de caracter opcional que tienen que ver con las aplicaciones 
y/o el uso de Python que reservamos para el lector interesado. Hemos marcado 
con * aquellos ejercicios que pueden resultar de mayor dificultad y hemos 
incluido en el apendice C las soluciones a los ejercicios de repaso. 

La version electronica de este libro estara siempre disponible en descarga 
directa en la direction que figura al final de la pagina de creditos. Agradecemos 
de antemano al lector cualquier sugerencia que nos haga llegar para mejorar el 
contenido de este libro. 


Ciudad Real, 9 de junio de 2016. 

El autor. 
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1 Numeros complejos 


Este tema esta dedicado a introducir un nuevo conjunto de numeros: los 
numeros complejos , habitualmente denotado corno C, y que sera necesario usar 
en determinados momentos a lo largo de este texto. Se pretende dar una 
introduction rapida a las operaciones algebraicas con numeros complejos, su 
representation grafica y el calculo de potencias y raices. Ademas veremos un 
resultado central, conocido como el Teorema Fundamental del Algebra , que nos 
sera de especial utilidad en el tema 6. Dedicaremos tambien una section a 
la realization de calculos con Python y veremos como los numeros complejos 
permiten delinir objetos interesantes como los fractales. 


EL CUERPO DE LOS NUMEROS COMPLEJOS 

El conjunto de numeros complejos surge de forma parecida al resto de 
conjuntos numericos. El lector debe conocer que el conjunto de numeros enteros 
(denotado por Z) se necesita para poder realizar la operation differentia en 
el conjunto de numeros naturales (N), mientras que el conjunto de numeros 
rationales (Q) es introducido para permitir la division entre numeros enteros. En 
la misma lfnea, el conjunto de numeros complejos viene a cubrir la imposibilidad 
en el conjunto de numeros reales (R) de obtener la rafz de un numero negativo. 1 

Recordemos que la resolution de una ecuacion de segundo grado en R 
depende del signo del discriminante 


ax 2 + bx + c = 0=>x = 


— b ± \/6 2 — 4ac 
2 a 


de mo do que: 

(i) si b 2 — 4 ac > 0 tenemos dos soluciones, 

1 El termino numero complejo fue introducido por el aleman Carl Friedrich Gauss hacia 

1831 aunque ya en los trabajos de matematicos griegos surge la primera referenda conodda 
a raices cuadradas de numeros negativos como resultado de una imposible seccion de una 
piramide. Mucho mas tarde, el matematico italiano Gerolamo Cardano se dio cuenta de que 
podfan manejarse cantidades mas generales que los numeros reales cuando intentaba encontrar 
una formula para resolver ecuaciones cubicas, en tor no al ano 1540. 
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(n) si b 2 — 4 ac = 0 hay una unica solution (doble), 
(in) si b 2 — 4ac < 0 no hay solution (real). 


El conjunto de numeros complejos se introduce con la finalidad de evitar la 
discusion anterior. Para ello comenzamos con la siguiente definition: 



Se define la unidad imaginaria como i = T, o de forma equivalente, 
i 2 = - 1. 


Con esta definition, si b 2 — 4ac < 0 => — {b 2 — 4ac) > 0 y 

— b± \Jb 2 — 4ac — b ± —b± i\/—b 2 + 4 ac 

2a 2a 2 a 

Observemos que i es un nuevo numero, 2 aquel cuyo cuadrado es — 1, que permite 
salvar la imposibilidad existente en K de realizar operaciones que involucren 
rafces negativas. A partir de este nuevo numero, definimos los numeros complejos 
del siguiente modo: 



Un numero complejo es una expresion de la forma z = a + i/3, donde cr, 
/3 S M. a es denominada la parte real , Re(z), mientras que /3 es la parte compleja 
o imaginaria , Im(z). Esta expresion se conoce como forma binomial o cartesiana 
del numero complejo. 


Asf, dos numeros complejos seran iguales si sus partes reales e imaginarias 
respectivas son iguales. 


Si/3 = 0=>z = a€K;es decir, los numeros reales forman un subconjunto 
de los numeros complejos, aquellos cuya parte imaginaria es nula. Si a = 0 el 
numero complejo z = i/3 se denomina imaginario puro. 



2 La notation se debe al suizo Leonhard Euler, que la introdujo en 1777, aunque la adoption 
por parte de Gauss en 1801 fue la que lo hizo un slmbolo habitual. En ingenierla electrica, 
electronica y areas relacionados, la unidad imaginaria es a menudo escrita como j para evitar 
la confusion con la intensidad de corriente electrica, tradicionalmente denotada por i. 
























1.1 * El cuerpo de los numeros complejos 


Operaciones con numeros complejos 

La suma, resta y multiplication de numeros complejos 3 se realiza siguien- 
do las operaciones algebraicas habituales para binomios, es decir, 

(ai + i/3i) ± (a 2 + ifo) = («i ± a 2 ) + i(P 1 ± P 2 ) 


(ai + */3 i)(a 2 + i/3 2 ) 


a.\a 2 + iaiP 2 + ia 2 /3i + i 2 /3iP 2 

(«ia 2 - /3 i/3 2 ) + z(«i/ 3 2 + a 2 ft) 


Notese como se ha usado que i 2 = — 1. 


Realicemos algunas operaciones basicas: 


(2 + 3i) + (5 - 2i) = 7 - i 
(3 + 2 i) + (5 - 2 i) = 8 
(2 + 3*) (5 — 2i) = 16 + Hi 
(3 + 2i)(5 — 2i) = 19 + 4 i 


(1 + i)- (2 + 5*) = -1 -4* 
(1 + i) — (1 + 2 i) = —i 
(l + i)(2 + 5i) = -3 + 7* 

(1+ *)(! +2*) =-1 + 3* 


Para efectuar la division de numeros enteros necesitamos la siguiente defini- 
cion: 



Si z = a + i/3 £ C, se define el conjugado de z, y se denotara por z, como el 
numero complcjo z = a — i/3. 


Es decir, el conjugado de un numero complejo no es mas que un nuevo 
numero complejo que tiene la misrna parte real, y su parte imaginaria es la 
opuesta. La operation de conjugation posee las siguientes propiedades: 



Si 2 , w £ C se verifica: 


3 Las reglas para estas operaciones fueron desarrolladas por el matematico italiano Rafael 
Bombelli en un tratado de Algebra publicado en 1572. 
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(i) 


z — z. 


(il) z + w = z + w. 

(in) z = z O z e s real. 

(iv) z = — z +>■ z es imaginario puro. 

(v) Si z = a + i(3 ^ 0, entonces zz = a 2 +/3 2 £ M + = {x £ K. : x > 0}. 

(vi) z ■ w = z-w 


La demostracion se deja como ejercicio al lector (ejercicio 19). 


La division entre numeros complejos se basa en usar adecuadamente la 
propiedad (v). En concreto, 


a + ij.3 (a + i/ 3 ) (7 + iS) (a^ + (38) + i(—a5 + 07 + (38 .fi'y — aS 

7 + iS (7 + i<5)(7 + iS) 7 2 + S 2 J 2 + 8 2 + * y 2 + 8 2 

La expresion anterior nos proporciona la forma de dividir numeros complejos: 
se trata de multiplicar numerador y denominador por el conjugado del denomi- 
nador y realizar las operaciones correspondientes. 



2 + 3 i (2 + 3z)(5 + 2i) 4+19 i 

5-2* “ (5 — 2z)(5 + 2i) ~ 29 

1 + i (1 + *)(1 — 2i) 3 -i 


3 1 

— — —% 


4 19 

-1- i 

29 29 


1 + 2? (1 + 2z)(l — 2i) 5 


1 


i(2 + 1) 


-1 + 2 i 


1 2 



2 — i (2-i)(2 + i) 


5 



























1.2 ■ Representation grafica: modulo y argumento 



Las operaciones suma y producto de numeros complejos satisfacen las pro- 
piedades habituales de asociatividad, conmutatividad, existencia de elemento 
neutro, elemento simetrico (el opuesto en el caso de la suma y el inverso en el 
caso del producto) y propiedad distributiva del producto respecto de la suma 
(vease el apendice A). Como consecuencia, C, al igual que K 6 Q, tiene estruc- 
tura de cuerpo conmutativo. Sin embargo es importante notar que, si bien K 
y Q son cuerpos ordenados (con la relation de orden <), C no lo es, es decir, 
no tiene sentido la expresion z\ < zn para Zi,Z 2 € C (salvo que sean numeros 
reales). 


□ IS - 

REPRESENTACION GRAFICA: MODULO Y ARGUMENTO 

Un numero complejo z = a+i/3 puede considerarse como un par ordenado de 
numeros reales (a, f3). Estamos acostumbrados a representar geometricamente 
un par de este tipo como puntos en el piano cartesiano, siendo a la abscisa y 
/? la ordenada. Asf pues, la identification entre el numero complejo z y el par 
(Re(z),Im(z)) nos permite representar graficamente un numero complejo como 
un punto del piano, que denominaremos piano complejo, 4 en el que el eje de 
abscisas pasa a llamarse eje real y el eje de ordenadas eje imaginario (ver 
figura 1.1a). 

Alternativamente, podemos representar tambien los numeros complejos co¬ 
mo vectores en el piano, de rnanera que el numero complejo z = a + i(3 puede 
identificarse con el vector que une los puntos (0,0) con (a, j3) en el piano (ver 
figura 1.1b). Esta otra representation permite identificar elementos importantes 
de un numero complejo como son su modulo y su argumento. 



Dado un numero complejo z = a + i/3 se define su modulo , que se notara 
como \z\, por 

\z\ = \/zi = \J ol 1 + /3 2 


Como se puede observar, el modulo de un numero complejo coincide con el 
modulo del vector (la longitud) que lo representa (ver figura 1.1b), y es igual a 

4 Tambien conocido como piano de Argand, aunque en realidad fue el noruego Caspar Wessel 
en 1796 el primero que mostraba esta representacion grafica de los numeros complejos. 
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.2 



Figura 1.1: Representation grafica de un numero complejo 


la distancia entre el punto del piano correspondiente al numero complejo y el 
origen, siendo por tanto un numero real positivo salvo en el origen, cuyo modulo, 
obviamente, es cero. 



Si 2 £ R, entonces su modulo coincide con su valor absoluto, de ahi que la 
notation empleada sea la misma. 


Las principales propiedades del modulo se resumen en el siguiente resultado: 


— E 

Bi 

Mm 

(i) 

1*1 = 1*1 

= \ — z\,\/z & C. 

(n) 

is* 

to 

II 

|-2l \Z 2 , VZ!,Z 2 € C. 

(in) 

VI 

'oT 

VI 

Ph 

(IV) 

i—i 

3^ 

IA 

VI 

jf 

(V) 

Desigualdad triangular: \z± + z 2 \ < \z±\ + \z 2 \, Vz\,z 2 £ C. 

(VI) 

\zi - 22 1 

> ||zi| - | z 2 11 , 'izi,z 2 e C. 
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Para la demostracion veanse los ejercicios 20 y 21. 

Atendiendo a la figura 1.1b, para cada numero complejo 2 € C\{0} tambien 
podemos considerar el angulo 9 que forma el vector que define z con el semieje 
real positivo. Este angulo se toma en radianes y se usa el criterio habitual 
de signos, que considera angulos positivos los recorridos en sentido antihorario 
y angulos negativos los del sentido horario. Entonces, la conocidas relaciones 
trigonometricas conducen a 

Re(z) = \z\ cos0, Im(z:) = \z\ sen.6 (1.1) 


Debido a la periodicidad de las funciones reales trigonometricas, la igualdad 
anterior sigue siendo valida para 9 + 2kn, para cada k £ Z. Teniendo esto 
presente podemos dar la siguiente definition: 



Dado un numero complejo z = a + ifi ^ 0 se define el argumento de z, y se 
notara por arg(z), al conjunto 

arg(^) = {9 £ R : a = \z\ cos 9, /? = \z\ send} 


El argumento de 0 no esta dcfinido. 

Se denomina argumento principal de z 6 C\{0}, y se notara por Arg(z), al 
unico numero 9 £ arg (z) tal que —tt < 9 < n. 


Es importante resaltar el caracter no um'voco del argumento de un numero 
complejo. Es decir, el argumento no es un unico valor, sino un conjunto de ellos. 
Este hecho tiene importantes consecuencias en la definition de ciertas funciones 
complejas (que no seran tratadas en este texto) y en el calculo de rafces que 
veremos en la section 1.4. 



Gracias a la representation grafica, la operation de conjugation puede verse 
de forma sencilla en terminos del modulo y el argumento. Mas concretamente, 
el conjugado de un numero complejo corresponde a un vector simetrico respecto 
del eje real, por lo tanto posee el mismo modulo y opuesto argumento, es decir, 

\z\ = \z\, arg(z) = — arg(z) 

Del mismo modo, la suma de numeros complejos corresponde a la suma de 
vectores que el lector conocera de cursos anteriores, la conocida como regia del 
paralelogramo. 
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Representemos en el piano complejo los numeros 3, ^ — \i y — 2 + 2z (vease 
la figura 1 . 2 ). 

El modulo de cada uno de ellos es |3| = 3, = 1 y | — 2 + 2i\ = -\/8 

y sus argumentos principales: 

Arg(3) = 0, Arg(^ + \i) = -§, Arg (-2 + 2i) = f 


—2 2i 

•. 

3 



. V3 , 1 • 

2 ' 2 C 


Figura 1.2: Representation de numeros complejos del ejemplo 1.3 


□ 1 - 

FORMA TRIGONOMETRICA Y FORMA POLAR 


Si z 7 ^ 0 es un nurnero complejo, para cada 9 £ arg(z), en virtud de (1.1), 
podemos escribir 


z = |z|(cos 0 + isen9) 


( 1 . 2 ) 


De hecho, tambien es cierto si z = 0, para cualquier 9 £ R. 













1.3 ■ Forma trigonometrica y forma polar 



A la expresion (1.2) se le denomina forma trigonometrica de un numero 
complejo. 



Dado 9 £ R, se define e lS = cos 9 + i sen (9, que se conoce como formula de 
Euler. 


Si ahora usamos (1.2) se tiene 

z = \z\e ie , 9earg(z) (1.3) 



A la expresion (1.3) se le denomina forma polar 5 de un numero complejo. 


La forma polar de los numeros complejos facilita la multiplication y division 
de los mismos gracias a las propiedades de la exponential. Asf, si Z\ = rie l£>1 y 
z 2 = r 2 e l02 entonces 

z 1 z 2 = r x r 2 e i ^ +e *\ Z A = r A e ^-e 2 ) 

Z 2 r 2 

Esto nos permite representar graficamente el producto y el cociente de numeros 
complejos. Asf, el producto de dos numeros complejos tiene como modulo, el 
producto de los modulos, y como argumento, la surna de los argumentos. Es 
decir, si z,w £ C\{0} entonces 

arg (zw) = arg (z) + arg (w) 

No obstante es importante resaltar que la igualdad anterior es una igualdad 
entre conjuntos. 5 6 Es decir, se verifica que 

arg(z 2 ) = arg(z) + arg(z) 

pero este hecho no es cierto para los argumentos principales. Por ejemplo, 
Arg((— i) 2 ) = Arg(—1) = 7r pero Arg(—i) + Arg(— i) = —tv. 

5 En ocasiones, para un numero complejo escrito en forma polar como 2 = re 1 ® se usa la 
notacion z = r#, en la que es habitual expresar el argumento en grados. 

6 Dados dos conjuntos A y B, se define la suma A + B como el conjunto A + B = {a + b : 
a e A, b e B} 
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□ □ - 

POTENCIA Y RAIZ N-ESIMA DE UN NUMERO COMPLEJO 


La potencia natural de un numero complejo se calcula facilmente usando la 
forma polar; si n £ N, 


z = re ld => z n = r n e in6 


Usando la forma trigonometrica se puede deducir la conocida como formula de 
de Moivre 7 

cos (n0) + i sen (nO) = (cos 6 + i sen 9) n (1.4) 


Por otro lado, dados w £ C y n £ N, se define la razz n-esima de w 
como el numero complejo 2 tal que z n = w. Para realizar el calculo hemos 
de usar nuevamente la forma polar, pero en este caso es necesario usar todos 
los valores del argumento. Mas concretamente, si w = re , escribiremos 
w = re d e + 2fc7r ) ; de rnodo que 

z n =w=>z= ( 1 . 5 ) 

El resultado tiene como modulo y/r, que es la rafz n-esima de un numero real 
positivo, mientras que para cada valor de k £ Z aparecen, inicialmente, infinitos 
argumentos. Sin embargo, atendiendo a los angulos que corresponden a estos 
argumentos observamos que, si tomamos cualesquiera n valores consecutivos 
de k, obtenemos n angulos distintos, mientras que para el resto, los angulos 
obtenidos vuelven a repetirse. Es decir, la rafz n-esima de un numero complejo da 
lugar a n valores distintos, los cuales pueden obtenerse con n valores consecutivos 
de fc; tipicamente tomaremos k = 0, 1, ... ,n — 1. 

Es mas, atendiendo a los argumentos obtenidos se observa que las raices 
n-esimas forman un poligono regular de n lados centrado en el origen y de radio 
y/r (vease la figura 1.3). 


Calculemos los numeros complejos tales que 2 8 = 1 usando (1.5). En primer 
lugar obtenemos la forma polar de 1 = e z2fc7r , usando todos los argumentos. Asf 


z — i — e 


i2kn 


z = e i -s-, k = 0,...,7 


obteniendose las raices: 
e io = 1 
e iir = _x 


c 2 




e*2 = i, 


e iS r = 




52L y/2 y/2 ■ M 

e * = — A;— e 2 = ~ 1 ’ 




7 Denominada asf por el matematico frances Abraham de Moivre. La formula aparece 

publicada en un artfculo suyo en 1722. 








1.4 ■ Potencia y raiz n-esima de un numero complejo 



(a) z s = 1 


(b) z 8 = 1 


Figura 1.3: Rafces de la unidad 



Las rafces aparecen representadas en la figura 1.3b. 



iCuales de los siguientes numeros complejos 1 + *, —1 + *, —1 — iy 1 — i son 
rafces decimas de 32*? 

Si escribimos cada uno de estos numeros en forma polar, 


l + i=V2e i %, -l + i = v / 2 e i T ; -1 - i = V2e~ iS r, l-i = V2e~ i * 

calcular su potencia decima es facil: 

(1 + j) 10 = 32e*T = 32*, (-1 + *) 10 = 2,2e il M = -32*, 

(-1 - i) 10 = 32e _i T ZL = 32*, (1 - *) 10 = 32e" l T = -32f. 

Luego los numeros buscados son l + *y —1 — *. Notese que al tratarse del calculo 
de potencias naturales no es necesario tener en cuenta todos los argumentos a 
diferencia de lo que ocurre cuando calculamos rafces. 


Para finalizar, daremos un resultado que sera de vital importancia en el 
tema 6 y que afirma que C es un cuerpo algebraicamente cerrado, es decir, que 
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todo polinomio en C tiene al menos una rai'z. Por ejemplo, es facil ver que R no 
es algebraicamente cerrado, pues el polinomio x 2 + 1 no tiene raices reales. Este 
resultado, conocido como Teorema fundamental del Algebra , afirma lo siguiente: 


Teorema 1.1 (Teorema fundamental del Algebra) 


Si p(x) = ao + a\X + • • • + a n x n es un polinomio con coeficientes complejos 
(esto es, at £ C, Vi), entonces la ecuacion p(x) = 0 tiene n raices contando sus 
multiplicidades. 


Aunque existe una facil demostracion de este resultado, la maquinaria em- 
pleada para la misma excede los objetivos de este curso. S * * 8 

El interes principal que para nosotros tiene este resultado ocurre cuando el 
polinomio tiene coeficientes reales (es decir, at £ R, Vi). En tal caso, el polinomio 
tendra n raices (reales o complejas), y ademas, si 2 es una raiz compleja de p, 
entonces z tambien es raiz de p (vease el ejercicio 24). 

□ II - 

CALCULO CON PYTHON 

En esta section mostraremos como usar Python para operar con numeros 
complejos, a la vez que profundizaremos en el empleo del modulo SymPy 
presentado en el apendice B. Es esencial que el lector posea un minimo de 
conocimientos del lenguaje (que exponemos en el citado apendice), por lo que 
remitimos a su lectura antes de abordar cualquiera de las secciones dedicadas a 
Python. 

Por otra parte, es muy conveniente que el lector realice los ejemplos que 
exponemos aqui para habituarse al interprete Python. Para facilitar la com- 
prension de los ejemplos hemos numerado de forma consecutiva las lineas de 
ordenes introducidas en el interprete, simulando una determinada sesion inter- 
activa, por lo que de un ejemplo al siguiente se conservan las importaciones de 
los modulos realizadas previamente. Cuando los numeros de linea comienzan de 
nuevo, significa que hemos abierto una nueva sesion, y por tanto debemos volver 
a cargar ciertas funciones. 

S E1 primer matematico en enunciar un resultado parecido (que todas las ecuaciones de 
grado n tienen n raices) fue el frances Albert Girard en 1629, aunque no menciona que 
tales soluciones puedan ser complejas. El resultado se acepto como un hecho evidente por la 
comunidad matematica. El primer intento serio de demostracion se debio al tambien frances 

Jean Le Rond d’Alambert en 1746, pero la prueba tiene algunos puntos negros. Aunque es 

aceptado que la primera demostracion del resultado es debida a Gauss en 1799 en su tesis 
doctoral, la prueba no es completamente rigurosa segun los estandares actuales. Gauss dio 
otras tres pruebas del resultado a lo largo de su vida; la ultima aparecio en 1849, en el ultimo 

articulo que escribio, cincuenta anos despues de su primera demostracion. 
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□ BH Operaciones basicas 

Comenzaremos con ejemplos de operaciones algebraicas sencillas con Python. 
Como se ve en la seccion B.2, los numeros complejos estan accesibles en Python 
y operar con ellos es facil. Realicemos las siguientes operaciones: 

(2 — i) - (6 + 2*) = -4 - 3* 

(3 + 2*)(l-5*) = 13-13 
1 + i _ 3 1. 

1 + 2* ~ 5 ~~ 5* 

>>> 2-1j- (6 + 2j) 

(-4-3j) 

>>> (3 + 2j)*(1-5j ) 

(13—13j) 

>>> (1 + 1 j )/(1 + 2 j ) 

(0.59999999999999998-0.20000000000000001j) 


Como ocurre con las calculadoras, en el momento en el que aparecen numeros 
racionales el calculo se vuelve engorroso. Afortunadamente tenemos el modulo 
SymPy para operar de forma exacta. En este modulo tenemos definida la 
unidad imaginaria corno I, pero hemos de usar el operador de multiplicacion 
(a cliferencia del uso con j): por ejemplo, 

1 +* _ 3 1 . 

1 + 2* _ 5 ~~ V 


>>> from sympy import I,simplify 
>>> (1+I)/(1+2*I) 

(1 + I )/(1 + 2 * 1 ) 

>>> simplify(_) 

3/5 - 1/5 

Como podemos observar, la operacion A±fr no se realiza al momento (es tratada 
como una expresion simbolica), por lo que debemos simplificarla. Notese el uso 
del guion bajo (o underscore ) para referirnos al ultimo calculo realizado. Notese 
tambien que solo hemos importado las funciones del modulo que necesitamos. 
Podriamos haber escrito directamente 

>>> simplify(6/(2-I ) ) 

12/5 + 6*1/5 


que equivale a 

6 12 6 . 

2 - * ““ ~5" + 5* 

El modulo SymPy tambien dispone de funciones para calcular el conjugado, 
el modulo y el argumento de un numero complejo: 
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>>> from sympy import arg,abs,conjugate,sqrt,I 
>>> a= sqrt(3)+1 
>>> conjugate(a) 

3**(l/2) - I 

>>> abs(a) 

2 

>>> arg(a) 
pi /6 


que realiza los calculos 


Vs + i = Vs — i 



arg(v / 3 + i) 


7T 

6 


Observemos que hemos importado del modulo SymPy, ademas de las fun- 
ciones que vamos a usar, tambien la funcion sqrt (rai'z cuadrada). Recordamos 
aqul que esta funcion no viene por defecto con el micleo de Python y es nece- 
sario importarla. ^Que hubiera ocurrido si, en lugar de usar la funcion sqrt de 
SymPy, usamos la del modulo math: 

>>> from sympy import conjugate,I 
>>> from math import sqrt 
>>> a= sqrt(2)+1 
>>> conjugate(a) 

1.73205080756888 - I 


Insistimos en la ventaja de hacer las operaciones con funciones de SymPy, 
que, en la medida de lo posible, realizara las operaciones de forma exacta. Como 
hemos visto en el ejemplo anterior, SymPy es capaz de reconocer ciertos angulos 
habituales, pero obviamente, no hace milagros: 

>>> from sympy import arg,abs,sqrt,I 
>>> a= sqrt(2)+1 
>>> abs(a) 

3**(1/2) 

>>> arg(a) 

at an(2**(1/2)/2) 


que interpretamos como 


V2 i 


V~s 


arg(V2 + i) = arctan 


V2 

2 


Si necesitamos el valor real de alguna de las operaciones efectuadas con 
SymPy, podemos usar el metodo evalf 

>>> arg(a).evalf() 

0.615479708670387 
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esto es, 

arctan ^ = 0.615479708670387 

que al ser un metodo y no una funcion, no precisa importacion. 

DBS Operaciones avanzadas 

El modulo SymPy permite realizar calculos mas sofisticados con los numeros 
complejos: por ejemplo, reconoce la formula de Euler, y es capaz de simplificar 
operaciones trigonometricas: 

>>> from sympy import Symbol , E,I,re 
>>> x=Symbol(’x’,real=True) 

>>> a=E**(I*x) 

>>> b=a.expand(complex=True) 

>>> b 

I * sin(x) + cos(x) 

>>> c=a**3 

>>> d = c.expand(complex = True) .expand(trig = True) 

>>> d 

-3* cos(x) - I * sin (x) + 4*I*cos(x)**2*sin(x) 

+ 4* cos (x) **3 
>>> re(d) 

-3* cos (x) + 4*cos(x)**3 
>>> f=c.expand(complex=True) 

>>> re (f ) 
cos(3*x) 

>>> (re(f)-re(d)).expand(trig=True) 

0 


Notese el uso de la etiqueta adicional real=True en la funcion Symbol, cuyo 
significado es evidente: asume que la variable simbolica x es real. El numero e 
viene dado por E y la parte real es re. El metodo expand sirve para desarrollar 
expresiones, y admite etiquetas adicionales para usar desarrollos con complejos 
o trigonometricos (admite otras varias corno logaritmos, potencias, etc.). 

Los calculos prueban la formula: 

cos(3a;) = —3cos(a:) +4 cos 3 (a;) 

^Puede el lector encontrar una formula analoga para sen(3a;)? 

El modulo SymPy tambien permite encontrar las raices complejas de polino- 
rnios. La funcion solve nos proporciona las raices de una ecuacion del siguiente 
rnodo: 

>>> from sympy import Symbol,solve 
>>> x=Symbol(’x’) 

>>> solve(x**4-l,x) 

[1, -1, -I, I] 
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esto es, 

i 4 - 1 = 0 => i = 1, —1, i , —i 

Si el resultado esperado es amplio podemos guardarlo en una lista 

>>> from sympy import I 
>>> a=solve(x**4-I,x) 

>>> a 

[-sin(pi/8) + I*cos(pi/8), 

-I*cos(pi/8) + sin(pi/8), 

-cos(pi/8) - I * sin(pi/8) , 

I*sin(pi/8) + cos(pi/8)] 


y luego podemos usar un bucle para, por ejemplo, obtener los valores numericos 
de cada una de las soluciones: 


>>> for b in a: 

... b.evalf ( ) 


-0.38268343236509 + 

0.38268343236509 - 

-0.923879532511287 

0.923879532511287 + 

0.923879532511287*1 

0.923879532511287*1 

- 0.38268343236509*1 

0.38268343236509*1 


um - 

UNA BREVE INCURSION EN EL MUNDO FRACTAL 

Los fractales 9 son objetos geometricos cuya estructura, generalmente muy 
irregular, se repite en diferentes escalas. Esencialmente podriamos decir que un 
fractal es un objeto de dimension fraccionaria, aunque seria necesario dar una 
definition concreta del concepto de dimension al que nos referimos. 

Los primeros ejemplos de fractales ya aparecen a finales del siglo XIX, con 
la funcion de Weierstrass descubierta en 1872, que es una funcion continua en 
todos sus puntos pero que no es derivable en ninguno. El grafo de esta funcion 
es un objeto fractal. Posteriormente aparecieron otros objetos, como la curva de 
Koch 10 (vease la figura 1.4), que se trata de una curva continua que no posee 
tangentes (es decir, que no es derivable) obtenida mediante un procedimiento 
recursivo bastante simple: dado un segmento, se divide en tres partes, y la 
parte central se sustituye por dos segmentos de igual longitud a los anteriores 
formando un triangulo sin la base (vease la figura 1.4a). El proceso se repite 
para cada uno de los segmentos de la nueva figura, y el objeto obtenido en el 
lfmite es la mencionada curva. 

®E1 termino fue acunado por el matematico frances de origen polaco Benoit Mandelbrot, 
en un arti'culo publicado en 1967 por la revista Science titulado iCuanto mide la costa de 
Gran Bretana? 

10 Descubierta por el matematico sueco Helge von Koch en 1904. 






1.6 ■ Una breve incursion en el mundo fractal 



.a/\a/ \a/\a. 


(a) Iteraciones de la curva de Koch 



Es facil darse cuenta de que la longitud de esta curva es infinita, pues en 
cada iteration estamos incrementando su longitud: por ejemplo, si el segmento 
initial (el de arriba a la izquierda en la figura 1.4a) tiene longitud 1, la primera 
iteration tendra longitud la segunda yy. la tercera (|) 3 , ..., y en la n- 
esima iteration, la longitud sera de (|)", de modo que la longitud li'mite sera 
infinita. Este hecho nos invita a pensar que, de algun modo, este objeto no es 
unidimensional. Usando la definition oportuna se puede encontrar la dimension 
fractal de este objeto que es = 1.261... 

Este tipo de objetos fueron considerados durante cierto tiempo por la cornu- 
nidad matematica como anomalias artificiales 11 y apenas recibieron atencion. 
Tras el nacimiento de la Teoria del Caos , 12 el interes por estos objetos se renue- 
va, ya que los fractales aparecen vinculados a la evolution de sistemas complejos. 
Posteriormente, y en especial a partir de la publication del libro de Mandelbrot, 
La Geometria Fractal de la Naturaleza (1982), los fractales son usados para des- 
cribir la complejidad de ciertas formas en la naturaleza, desde las nubes hasta 
las redes neuronales del cerebro. 

^Que relation hay entre los numeros complejos y los fractales? Uno de los 
fractales mas conocidos, el denominado conjunto de Mandelbrot, 13 es un objeto 
del piano complejo que se genera de forma sencilla. Se considera un nurnero 

11 Una galena de “monstruos”, como los denomino el matematico trances Henri Poincare. 

12 Surgida a partir del estudio de un modelo climatico por el matematico estadounidense 
Edward Lorenz en 1963. 

13 Las primeras imagenes del mismo se obtuvieron en 1978 por Robert Brook y Peter 
Matelski, pero fueron el matematico trances Adrien Douady y su disctpulo John H. Hubbard 
quienes demostraron muchas propiedades fundamentales y lo nombraron ast en honor a 
Mandelbrot. 
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complejo cualquiera c, y se construye una sucesion por recurrencia del siguiente 
modo: 

z 0 = 0, z n+ 1 = z* + c, n > 0 

En funcion del numero c escogido, esta sucesion puede o no estar acotada. Por 
ejemplo, si c = 2, la sucesion que se genera es 0,2,6, 38,... que es claramente no 
acotada; pero si c = — 1 , la sucesion queda 0, — 1 , 0 , — 1 ,... que si esta acotada. 
El conjunto de Mandelbrot esta formado por los numeros complejos c tales 
que la sucesion anterior permanece acotada. Es clecir, — 1 es un punto que 
esta en el conjunto de Mandelbrot, pero 2 no pertenece a dicho conjunto. Si 
analizamos el comportamiento de la sucesion con todos los puntos del piano 
complejo obtenemos la figura 1.5a, en la que se aprecia el aspecto general del 
conjunto de Mandelbrot. Las figuras 1.5b y 1.5c muestran aproximaciones (las 
indicadas en los recuadros) con mas detalle. Podemos ver la “autosimilitud” 
caracteristica de los fractales (se repiten en escalas cada vez mas pequenas) y el 
“orden dentro del caos” que subyace en los misrnos. 14 


□ □□ Generacion del conjunto de Mandelbrot con Python 

Adjuntamos aqui un breve programa en Python con el que obtener los grafi- 
cos aqui mostrados. Para su funcionamiento se precisa del modulo matplotlib 15 
para poder generar graficos con Python. 


#! /usr/bin/python 

from numpy import array,zeros 

from matplotlib.pyplot import imshow,xticks ,yticks , show 

def mandelplot(size , limit , xint , yint) : 

img = zeros ( [size , size], int) 

xamp = xint [1]-xint [0] 
yamp = yint [1]-yint [0] 

for y in range(size): 

for x in range(size): 

c = complex(x/float(size)*xamp + 

xint [0] ,y/float(size)*yamp + yint 
[ 0 ]) 
z = c 

for i in range(1imit): 

z = z**2 + c 


14 Precisamente esta caracteristica de los fractales, la aparicion de cierta regularidad dentro 
del caos, fue lo que llamo la atencion de Mandelbrot cuando intentaba descifrar la causa 
de la existencia de determinado ruido en las lfneas telefonicas que usaban para transmitir 
informacion en la red de ordenadores de la compama IBM, en la cual trabajaba. 

15 Se puede descargar desde http://matplotlib.sourceforge.net/. 
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if abs(z) > 2: 

21 

break 

22 

else : 
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25 

img = array ( img/float(img.max())) 

26 


27 

asp=yamp/xamp 

28 


29 

imshow(img,interpolation=’bilinear 1 ,origin=’lower ’ , 


cmap=’binary ’ ,aspect=asp) 

30 


31 

xticks ( [] ) 

32 

yticks ( [] ) 

33 

show ( ) 

34 


35 

return 

36 


37 


38 

puntos = 1000 

39 

limite = 250 

40 

xint = [ -2 . , 1 . ] 

41 

yint = [-1.5,1.5] 

42 


43 

mandelplot(puntos,limite,xint,yint) 


El funcionamiento del programa consiste en, dado un determinado conjunto 
de puntos del piano complejo, analizar las iteraciones de la sucesion que define 
al conjunto en cada uno de esos puntos. Si en algun momento de la iteration 
el modulo es mayor que 2, automaticamente sabemos que ese numero complejo 
no va a pertenecer al conjunto de Mandelbrot. Por el contrario, si despues de 
haber realizado un cierto numero de iteraciones, el modulo sigue siendo menor 
que 2, consideramos que ese punto esta dentro del conjunto. 

Analicemos con mas detenimiento el codigo: La finea 1 es el shebang comen- 
tado en la section B.1.1. Las lineas 3 y 4 cargan las funciones a usar desde los 
modulos y entre las lineas 6 y 35 definimos la funcion que hace todo el trabajo 
y que invocamos en la linea 43. 

Los argumentos de entrada de la funcion son: size, limit, xint e yint 
que son definidos en las lineas 38 a 41. Estos dos ultimos son dos listas que se 
refieren al dominio en el que se van a realizar los calculos: xint nos da la cota 
inferior y superior para la parte real de los mimeros complejos a considerar, 
e yint define las cotas para la parte imaginaria. El parametro size define el 
numero de subdivisiones que vamos a realizar en cada intervalo xint e yint y 
el parametro limit se refiere al numero maximo de veces que vamos a realizar 
la iteration que define al conjunto. 
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(a) Rectangulo [—2,1] X §] 




Figura 1.5: El conjunto de Mandelbrot 
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La funcion, una vez introducidos los parametros, crea una matriz de ceros 
de tamano sizexsize (lfnea 8); en las lfneas 10 y 11 calcula la amplitud de la 
region a dibujar y entre las lmeas 13 y 23 esta el doble bucle que recorre cada 
uno de los puntos c de la region a considerar (definidos en la lfnea 15). 

Para cada punto, se entra en un bucle f or-else (lmeas 17-23) en el que se 
analiza si el punto esta o no en el conjunto de Mandelbrot. Para ello se van 
construyendo los elenrentos de la sucesion (lfnea 18) hasta la iteration limit 
(como maximo). Si en algun elemento de la sucesion el modulo es mayor que 2 
entonces se interrumpe el bucle (lmeas 20-21) y se pasa a analizar el siguiente 
punto. Notese que el elemento correspondiente a la matriz img va sumando 
1 cada vez que se construye un elemento de la sucesion (lfnea 19). Asf, si 
interrumpimos el bucle en un punto porque el modulo es mayor que 2, habremos 
asignado a la matriz el fndice de la sucesion en el que se ha obtenido la condition 
de salida. 

Por el contrario, si el bucle for fmaliza sin un break (es decir, los elenrentos 
de la sucesion se mantienen todos con modulo menor o igual que 2), entonces se 
ejecuta el bloque else (notese el sangrado), poniendo el elemento de la matriz 
a 0 (lfnea 23). 

A1 finalizar el doble bucle (lmeas 17-23), el programa habra construido una 
matriz en la que cada elemento guarda un fndice entero para cada punto del 
rectangulo del piano conrplejo analizado. Este fndice vale 0 si el punto esta 
en el conjunto, y es distinto de 0 si no lo esta. Indices altos indican que ha 
costado decidir si el punto esta o no en el conjunto, mientras que indices bajos 
corresponden a puntos que rapidamente han sido descartados por su pertenencia 
al conjunto. Este rango de indices nos va a permitir dar color al dibujo. Si solo 
hubieramos indicado la pertenencia al conjunto con un 1 o un 0 apreciarfamos 
menos detalles en la grafica. El lector puede probar con distintos valores del 
parametro limit para corroborar esto. 

La lfnea 25 normaliza los valores de la matriz img dividiendo por el mayor 
valor de esta (lo que se obtiene con img.maxO). Observese tambien la necesidad 
de convertir a un niimero real con float. La matriz ahora tendra valores reales 
entre 0 y 1. 

Finalmente, la funcion imshow de matplotlib crea un dibujo a partir de la 
matriz coloreando cada pixel en funcion del valor (el coloreado usado en este 
caso ha sido binary). Las funciones xtick e ytick eliminan la information sobre 
los ejes y showO muestra el resultado. 

El codigo de la funcion (lmeas 6-35) no se ejecuta hasta que la funcion no es 
llamada en la lfnea 43. Las lmeas 38-41 definen los parametros con los que se ha 
obtenido la figura 1.5a. El lector puede probar modificando estos valores para 
obtener distintas partes del conjunto, con cliferentes niveles de aproximacion. 
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□ 1 - 

EJERCICIOS 


Ejercicios de repaso 

|3| Realizar las siguientes operaciones con numeros complejos: 


(3-2 i) + (1 - 5*) 
(2 + 5*) (3 + i) 

1 + 3 * 

2-5 * 

- - 2i(2 - i) 

i 


(2 — 2i) + 3* (1 + 2i) — (—1 + 2i) 

(1 + *)(1 — i) 2i — (5 + 5*)(3 — 6*) 
4 — 7* i 

3 + 5* 2 — * 

* 2 — * 3* — 1 ^ 

5 2 + * * 


IM Obtener el conjugado de los siguientes numeros complejos: 

1 , 

*, 3 — 2*, 7r + e — *, e —7r, -, §* — 1 

* z 

|3| Calcular el modulo y el argumento principal de los siguientes numeros 
complejos y representarlos en el piano complejo: 

—2, — *, 5 — 5*, —3^3 + 3*, —1 — \/3 *, —2 — 2* 


|3| Escribir en forma polar y trigonometrica los numeros complejos del 
ejercicio 3. 

I am Escribir en forma cartesiana los siguientes numeros y representarlos en 
el piano complejo: 


A7i r 


3e l + 


2e 1 , \e l e , 


2 

— P 1 4 

3 C ’ 


|3| Calcular las siguientes potencias: 

* 5 , (1-V3*) 5 , (—2 + 2*) 8 , (i-^*) 10 


|3I Obtener en forma binomial todas las soluciones de las siguientes ecuacio- 
nes: 

z 4 = 2, z 3 = |*, z 6 = —1 
131 Resolver las siguientes ecuaciones en C: 

z 2 + 5 = 0; z 2 + z + 1 = 0; z 3 + z 2 + z = 0; 


z 2 + 2z + 5 — 0; z 3 - 3z 2 + 5z = 15; 2 3 + 2z 2 + 4z = -3. 








1.7 * Ejercicios 


Problemas 


Escribir en forma cartesiana los numeros 


(1 + v ^) 3 

(v^ + i) 2 ’ 


100 


•501 


+* 6o °, J 2 ik 


k—0 


Indicacion: para el ultimo usar la formula a k = —— 


1 - a n+1 


k =0 


3 ^En que cuadrante se encuentran los siguientes numeros? 


(2000eT Ii + l) 7 , (5000e^ ti + 2) 


n 


law Sea 2 £ C tal que z 6 = —64, Re(^) < 0 y Im(^) < 0. Calcular z 4 . 

3H Calcular w = (1 — i) 12 z~ l , donde z es tal que z 4 + 1=0, Re(^) > 0 y 

Im(z) > 0. 

law Si x £ R. y n £ N, calcula el valor de 

/1 + cos x + i seni\ n 
V1 + cos x — i sen x ) 


WEI Determinar los numeros complejos que satisfacen: 

(a) ^ = \z\ (b) z = z 2 

U0 Halla las numeros complejos que forman los vertices de un hexagono 
regular de centro el origen, sabiendo que tiene uno de sus vertices en el nurnero 
i. 


nes: 


Describe los conjuntos de numeros complejos que satisfacen las ecuacio- 
(a) \z\ <3 (b) \z - i\ > 2 *(c) \z + 1| + \z - 1| = 4 


Encontrar el lugar geometrico descrito por la ecuacion 


Z±1 

2-1 


= 2 . 


Ejercicios teoricos 

ia>l:l Probar que para cada z £ C, 

Re(*) = ^, Im(^) = ~2i~ 

IatBl Demostrar la Proposicion 1.1. 

|3S!| Probar (i)-(iv) de la Proposicion 1.2. 

*|2£J En este ejercicio se pretende demostrar la desigualdad triangular (vease 
(v) de la Proposicion 1.2). Para ello: 
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(a) Probar que 2af3 < a 2 + j3 2 , Va, /3 £ R. 

(b) Usar (a) para probar que 

ona 2 + /3i/ 3 2 Pl){a\ + /3f), Van, a 2 , fii, /3 2 £ R 

(c) Usar (b) para probar que Z 1 Z 2 + ziz 2 < 2|^i| 1 2 : 2 1, Vzi,z 2 £ C. 

(d) Deducir de (c) la desigualdad triangular y (vi) de la Proposition 1.2. 
*|3gej Decidir si las siguientes afirmaciones son verdaderas o falsas: 

(a) Los puntos z, w, —z y —w forman un cuadrado si y solo si ^ es imaginario 
puro. 

(b) Los puntos z, w y 0 estan alineados si y solo si ^ es imaginario puro. 

(c) Los puntos z, w y 0 estan alineados si y solo si ^ es real. 

*1221 Sean Zk, k = 0,..., n — 1 las raices n-esimas de la unidad. Probar que 

n— 1 

^Re(2 fe ) = 0 
k —0 

Indication: usar la ayuda del ejercicio 9 

1221 Probar que si p(x) = ao+aia:+- ■ -+a n x n es un polinomio con coeficientes 
reales (esto es, a, £ R, Vi) y Zo es una raiz de p entonces Zg tambien es raiz de 
p. /,Es cierto esto si algun a* £ C? 

Ejercicios adicionales 

| 22 ] Usa la formula de Euler en Python para obtener una identidad trigo- 
nometrica para sen(5a:) y cos(5a;). 

| 22 ] Los Conjuntos de Julia 16 son fractales que se generan de forma similar 
al conjunto de Mandelbrot: se considera un numero complejo £ fijo, y para cada 
c £ C se construye la sucesion 

z 0 = c z n+ 1 = z 2 + £, n > 0 

El conjunto de Julia generado por £ es el conjunto de numeros complejos c para 
los que la sucesion anterior permanece acotada. Adaptar el codigo en Python 
de la section 1.6.1 para dibujar los conjuntos de Julia para £ = 0.72 — 0.196i y 
£ = -0.1 + 0.87*. 


lfl Llamados asi en honor al matematico frances de origen argelino Gaston Julia. 




M wtk. 


2 Matrices y determinantes 


Introducimos en este tema una de las herramientas fundamentales del Alge¬ 
bra, las matrices, con las que trabajaremos a lo largo de todo el texto. Es 
probable que el lector haya tenido ya un contacto previo con estos objetos asf 
como con los determinantes, por lo que este tema consistira esencialmente en un 
repaso de tales contenidos aunque con un enfoque mas abstracto. Basicamente 
recordaremos las operaciones entre matrices, el metodo de Gauss y el calculo de 
determinantes, esperando que el lector adquiera una adecuada soltura operacio- 
nal con ellos. 

Puesto que el calculo matricial es sin duda tedioso, principalmente cuando 
el tamano de las matrices aumenta, incluimos tambien una section dedicada a 
la realization de estas operaciones con Python. De este modo el lector tendra 
la oportunidad de realizar los numerosos calculos que involucren matrices a lo 
largo del texto con rapidez. No obstante, es importante resaltar la importancia 
de saber realizar tales operaciones sin la necesidad del ordenador. Por ultimo, 
hacemos una pequena incursion en una de las multiples aplicaciones donde 
aparecen las matrices: la teorfa de grafos. 


EM - 

MATRICES: PRIMERAS DEFINICIONES 

En todos los ternas que siguen trabajaremos con conjuntos numericos con 
los que sera necesario realizar cierto tipo de operaciones. Mas concretamente, 
necesitaremos que tales conjuntos tengan estructura de cuerpo conmutativo 
(vease el apendice A), que denotaremos genericamente por K, y que en la 
practica puede ser Q, K. 6 C. En los casos en los que sea necesario precisar 
el cuerpo concreto con el que trabajar lo diremos expresamente. 

A los elementos del cuerpo los denominaremos escalares y se denotaran 
habitualmente con letras griegas: a, /3, 7 , etc. Tambien usaremos la notation 
IK" para referirnos al producto cartesiano lx x IK, es decir el conjunto de 

n-uplas (oq,..., a n ), donde cada € K. 


35 
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mam 


Una ordenacion rectangular 



se denomina matriz 1 de orden m x n (m filas y n columnas ), donde cada 
a,ij G K. Los elementos an, at 2 ,... ai n forman la fila i-esima, que denotaremos 
por Fi, mientras que los elementos cq j , d 2 j , • • •, a m j conforman la columna j- 
esima, denotada por Cj. El conjunto de matrices de orden mxn con coeficientes 
en K se denota por .M m x n (K). Para simplificar la escritura es frecuente notar 
a las matrices por A = (ctij)i<i<m o simplemente A = (dij), donde el primer 

l<j<n 

l'ndice siempre denotara las filas y el segundo las columnas. 

Una matriz A G A / li X n(K) se dira matriz fila y si A G A / l mx i(K) se dira 
matriz columna. 



Dos matrices A, B G A4 mxra (K) son iguales si los elementos correspondientes 
son iguales, es decir, = bij, 1 < i < m, 1 < j < n. 


Las matrices aparecen en multitud de situaciones por tratarse de objetos 
eficaces para tratar information de una manera ordenada. El siguiente ejemplo 
es una muestra de ello. 



Una empresa fabrica pilas electricas en tres tamanos: A, B y C, y dos voltajes: 
V\ y V2. El mimero de piezas fabricadas cada dia (en miles de unidades) viene 


1 El termino fue acunado por el matematico ingles James Joseph Sylvester en 1848, aunque 
ordenaciones de este tipo son conocidas desde la antigiiedad; por ejemplo, hay constancia de 
la aparicion de cuadrados magicos en la literatura china hacia el 650 a.C. 
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dada por la matriz F, y el precio (en centimos por unidad) en la matriz P: 



Como se puede observar, las matrices anteriores contienen la information 
sobre la production diaria de cada tipo de pila y sus precios. A partir de estas 
matrices podemos extraer information implicitamente contenida en ellas. Por 
ejemplo, la suma de todos los elementos de la matriz F nos proporciona la 
cantidad total de pilas fabricadas de todos los tipos. Si sumamos los elementos 
de cada columna obtendremos la cantidad de pilas fabricadas de los tipos A, B y 
C tanto en el voltaje V\ como en V 2 ■ Si por el contrario sumamos los elementos 
de cada fila, obtendremos la cantidad de pilas fabricadas por voltaje, de todos 
los tipos. 

Notese sin embargo que la suma de los elementos de la matriz P no adquiere 
un significado relevante. Es decir, la information que proporcionan las matrices 
depende completamente del contexto al que se refieran. 



Una matriz se dice cuadrada si m = n. El conjunto de matrices cuadradas 
de orden n con coeficientes en K se notara por _Ad n (IK). 

Una matriz cuadrada se dice simetrica si a^- = aji, Vi, j. 

Se denomina matriz traspuesta (o transpuesta ) de A = () (no necesaria- 
mente cuadrada) a la matriz A T = (aji), es decir, la que resulta al intercambiar 
sus filas por sus columnas. 


A partir de la definition se deduce que una matriz es simetrica si y solo si 
es igual a su traspuesta. 




Los elementos an, 1 < i < mni{m,n} son denominados elementos diagona¬ 
ls, y conforman la llamada diagonal principal de la matriz. 

Una matriz con ceros por debajo de la diagonal principal se denomina 
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triangular superior. Si los ceros estan por encima se dira triangular inferior , 
y si estan tanto encima como debajo se dira matriz diagonal. 



Observese que la trasposicion de una matriz corresponde a una “simetria” 
respecto de la diagonal principal. De este modo, una matriz simetrica es aquella 
que al trasponerla, no cambia. 


Las traspuestas de las matrices del ejemplo 2.1 son 



P T 


1 70 45 

yl20 65 



Operaciones con matrices 2 


Las operaciones mas simples que podemos realizar con matrices son la suma 
y el producto por un escalar , que se definen del siguiente modo: 



Dadas A,B£ -M mX n(lK), con A = (a^) y B = (bij), y a € K, se definen: 

(i) la suma de A y B como la matriz A + B G A4 mX n(K) donde ( A + B),j = 
( a ij + hj). 

(il) el producto por escalar de a £ K y A como la matriz a A £ A4 mxn (K) 
dada por ( aA)ij = aaij. 


2 Fueron introducidas por el matematico ingles Arthur Cayley en 1857. 
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Es decir, podemos sumar matrices siempre que arnbas tengan el mismo orden, 
y la matriz surna se obtiene sumando los elementos que estan en la misma 
position. Por otro lado, el producto de una matriz por un escalar es otra matriz 
en la que cada elemento esta multiplicado por ese numero. 



Los siguientes dos resultados establecen propiedades elementales de la suma 
y del producto por un escalar. Las demostraciones de estos resultados son 
consecuencia inmediata de la definition y de las correspondientes propiedades 
del cuerpo K. 



En consecuencia, el par (A^ mX n(K),+) es un grupo conmutativo (vease el 
Apendice A). 
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Sia,/3eKyA,i?e A4 mxrl (K) se verifican las siguientes propiedades: 
(i) Pseudoasociativa: a(/3A) = ( a/3)A 

(n) Distributiva respecto de la suma de escalares: (a + (3)A = aA + (3A 
(in) Distributiva respecto de la suma de matrices: a(A + B) = a A + aB 


Una vez vista la operation suma de matrices, parecerfa bastante natural 
definir el producto de matrices de forma analoga, es decir, multiplicando los 
elementos que se hayan en la misma position. Lamentablemente, el producto de 
matrices no se define de ese rnodo, sino de una forma un poco mas enrevesada: 



Dadas dos matrices A € At mX n(K) y Be M nxp ( K), con A = (a^) y 
B = (bkj) se define el producto de A por B como la matriz AB £ Ai mxp (K ) 
cuyos elementos vienen dados por 


n 



La figura 2.1 ilustra el proceso de multiplication. Para obtener el elemento 
Cij de la matriz producto AB debemos multiplicar cada uno de los elementos 
de la fila i de la matriz A por el correspondiente elemento de la columna j de 
la matriz B , y calcular la suma de todos esos productos. 

Por otra parte, hay que resaltar que para poder realizar el producto de dos 
matrices A y B, los ordenes de las matrices deben guardar una relation: en 
concreto, el niimero de columnas de A debe ser igual al numero de filas de B 
(para efectuar el producto AB). 



Multipliquemos las matrices F y P del ejemplo 2.1: 


20 • 70 + 19 • 45 + 18 ■ 60 20 ■ 120 + 19-65 + 18-50 
22 • 70 + 19 • 45 + 21 • 60 22 • 120 + 19-65 + 21-50 
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_ /3335 4535 
~ \3655 4925 

^Que significado tienen las entradas de la diagonal de la matriz producto? Por 
ejemplo, el elemento ( FP)n corresponde a la multiplication del numero de pilas 
fabricadas de los modelos de voltaje V\ por su precio correspondiente, de modo 
que el valor 3335 nos da el beneficio por la venta de todas las pilas de voltaje 
V\. Analogamente el elemento (FP )22 nos proporciona el beneficio de la venta 
de todas las pilas de voltaje V 2 . 

^Puede el lector averiguar el significado de los elementos diagonales de la 
matriz PF1 
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Es muy importante observar que ;el producto de matrices no es con- 
mutativo! En algunos casos simplemente no es posible hacer el producto en 
ambos sentidos, pues los ordenes no coinciden. Cuando si es posible hacer el 
producto en ambos sentidos, tampoco tiene por que ser conmutativo, como se 
muestra en el ejemplo 2.5 


Dadas las matrices 


f 1 °\ 

A — I 1 1 I € M 3x2 (R), 

V° v 




^ £ ^2x2(1®) 


entonces 


AB = 




BA no es posible, 






La matriz I n £ ^^(K), dada por 


0 
0 

1 

o abreviadamente ( I n )ij = fiij, 1 < < n, donde 5ij es el sfmbolo de 

Kronecker 3 , se denomina matriz identidad de orden n. 




3 El sfmbolo o delta de Kronecker viene definido por 


5 


ij 


f 1 si i= j 
\0 si f / j 


y le debe su nombre al matematico aleman Leopold Kronecker. 
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El producto de matrices verifica las siguientes propiedades: 


Proposition 2.3 (Propiedades del producto de matrices) 


Se verifican las siguientes propiedades (siempre que los productos sean posibles): 
(i) Asociativa: A(BC) = ( AB)C 
(n) Distributiva respecto de la surna: 

(por la derecha): (B + C)A = BA + CA 
(por la izquierda): A(B + C) = AB + AC 

(ill) Distributiva respecto del producto por escalar: 

(■ aA)B = A(aB) = a(AB) 

(iv) Elemento neutro: se verifica I m A = A, AI n = A, VA £ -M mX n(K), 
donde las matrices I n: I m son las matrices identidad de ordenes n y m, 
respect i vament e. 


La demostracion de estas propiedades se basa exclusivamente en las defini¬ 
ciones de las operaciones correspondientes, aunque resulta un poco tediosa. A 
rnodo de ilustracion, probaremos la asociatividad. 

Demostracion: 

(i) Consideremos las matrices 

A = (Uij')l<2<m5 B = (bjk)l<j<n y C = (Cfc/)i<fc<p 

1 <j<n 1 <k<p 1 <l<q 

Notese que los ordenes de las matrices deben ser los adecuados, pues en caso 
contrario no se podrian realizar los productos. Veamos que el elemento il de la 
rnatriz A(BC) es igual al elemento il de la rnatriz ( AB)C. 

Observemos que el elemento il de A{BC ) se obtiene al multiplicar la fila i 
de A por la columna l de BC. Asi pues, concentremonos en BC. Sus elementos 
(. BC)ji se obtienen (por definition) como: 

p 

(BC)ji = ]T bikCkl 
k =1 

Si ahora calculamos A(BC), 

n n / p \ n p 

((A(BC)) U = ^2^(30)^ E bik^kl = £E Q*ij bik^kl 

j—1 j—1 \k=1 / j=l k—1 
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Ahora hagamos lo mismo con ( AB)C. Los elementos de AB son: 


(AB^ik — ^ ' CLijbjk 
3 =1 


y por tanto: 

p p / n \ p n 

((-AB)C)n = ^ ] (AB) ik c kl = EE (Lijbjk j C-kl — EE dijbjkCkl 

k— 1 k— 1 \y — 1 ) fc=lj=l 

Puesto que los sumatorios son intercambiables, se obtiene el resultado. 


Terminamos esta apartado sobre operaciones con matrices viendo como 
afecta la trasposicion a la surna y el producto de matrices. 


Proposicion 2.4 (Propiedades de la trasposicion de matrices) 


Si A, B son matrices y a un escalar, entonces 

(i) (A T ) T = A. 

(ii) ( aA) T =aA T . 

(Ill) (A + B) t = a t + b t . 

(iv) ( AB) t = B t A t . 


Demostracion: 

La demostracion de (i)—(ill) es muy sencilla y se deja como ejercicio al lector. 
Para probar (iv) supongamos que A es una matriz de orden mxn con elementos 
(a z j ) y B una matriz de orden n x p con entradas bjj . Denotando por aL y b' l:) 
las entradas de A T y B T , respectivamente, esta claro que a l:j = oL y bij = 6' ; . 
Si ahora denotamos por cu a las entradas de la matriz AB , entonces sabemos 

que 

n 

C-il — ^ ^ ^ij bjl 
3 =1 

Denotando por d H las entradas de {AB ) T , entonces 

n n 

( AB )Ii = Cli = Cu = E a i3 b 3l = E b 'l3 a 'ji = ( BTAT h 
3=1 3=1 
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INVERSA DE UNA MATRIZ 


Es sabido que el inverso de un escalar es otro escalar tal que, al multiplicar 
por este, se obtiene el elemento neutro de la multiplication, es decir, el uno. 
De forma similar podemos definir la inversa de una matriz, teniendo presente 
que el elemento neutro del producto es la matriz identidad (vease (iv) de la 
Proposition 2.3). 



Dada una matriz cuadrada A £ .Ad n (K), se dice que la matriz B £ A4 n (K) 
es su inversa si AB = BA = donde I n £ A4„(K) es la matriz identidad. Se 
notara B = A -1 . 

Si existe una tal matriz se dira que A es regular o invertible. En caso contrario 
se dira que A es singular. 


Notese que la inversa solo esta defmida para matrices cuadradas, y como 
muestra el siguiente ejemplo, no siempre existe. 



(i) Las matrices 



verifican que AB = BA = I 2 (el lector puede comprobarlo facilmente), de 
manera que B = A~ x (o tambien A = B -1 ). 




, se deberia verificar 



a b 
c d 



lo que es imposible. 
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Si una matriz tiene inversa, entonces esta es unica. 


Demostracion: 

En muchas ocasiones, para probar la unicidad de un objeto matematico, es habi¬ 
tual suponer que existen dos de tales objetos, y deducir, usando sus propiedades, 
que en realidad son iguales. De lo que se sigue que el objeto es unico. Este es el 
metodo que empleamos aqui: supongamos que B y C son dos inversas de A, es 
decir, BA = AC = I n . Entonces, 

B = BI n = B(AC) = {BA)C = I n C = C 

Es decir, B = C, luego la inversa es unica. 


La siguiente proposition nos permite relajar ligeramente la definition de 
inversa, no siendo necesario comprobar la conmutatividad del producto. 



Si A, B € ,M„(K) y verifican que AB = /„, entonces BA = I n y por tanto 
B = A~ 1 . 


A pesar de que puede parecer evidente el resultado, la demostracion requiere 
un cierto esfuerzo, por lo que la omitiremos. 

El siguiente resultado nos muestra como funciona la inversion con el producto 
y la trasposicion de matrices. 


Si A, B e Ai ri (K), se tiene: 

(i) Si A y B son invertibles, entonces AB es invertible y ( AB) -1 = B~ 1 A~ 1 . 
(n) Si A es invertible, entonces A T es invertible y (A T ) -1 = (A -1 ) T . 



Demostracion: 


(i) Bastara ver que ( AB)(B X A = I n , lo cual es evidente usando la 
propiedad asociativa del producto de matrices. 














2.3 ■ Sistemas de ecuaciones lineales 


(ii) Si A es invertible, sabemos que AA 1 = I n , de modo que calculando 
traspuestas 

(AA- 1 ) T = £ = I n 

Por otro lado, (4LA _1 ) T = (A~ 1 ) T A T como vimos en (iv) de la Proposi¬ 
tion 2.4. Es decir, el producto de A T con es la matriz identidad, 

por tanto una es la inversa de la otra. 


El paso siguiente consiste en encontrar una forma de calcular inversas de 
matrices. El primer metodo que vamos a ver, el metodo de Gauss , probablemente 
es ya conocido por el lector. Para recordarlo, haremos una breve incursion en 
los sistemas de ecuaciones lineales, que retomaremos con mayor detenimiento 
en el tema siguiente. 


BB - 

SISTEMAS DE ECUACIONES LINEALES 


Posiblemente, el ejemplo mas habitual del uso de matrices esta en la represen¬ 
tation de sistemas de ecuaciones lineales , cuya definition damos a continuation. 


Se denomina sistema de ecuaciones lineal de m ecuaciones con n incognitas 
a una expresion del tipo siguiente: 


an*i + 012*2 + •••+ a\ n x n — bi 

021*1 + 022*2 4-h 0 2 n*n = &2 

> 


( 2 . 1 ) 


Om 1*1 4~ O m 2*2 4“ ' * ' 4" &mn%n — 


donde los a,; 7 - son denominados coeficientes, Xi son las incognitas y bi el termino 
independiente. 


Los sistemas de ecuaciones lineales aparecen frecuentemente en la resolution 
numerica de ecuaciones en derivadas parciales, en el planteamiento de proble- 
mas que provienen de la Fisica, la Economia, etc. En el tema 3 abordaremos 
cuestiones relacionadas con la resolution de este tipo de sistemas. De momento 
nos bastara con definir que entendemos por solution de un sistema. 
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Se denomina solution del sistema (2.1) a toda n-upla (aq,..., x n ) £ K™ que 
convierte la expresion (2.1) en una identidad. 


Las matrices son muy adecuadas para simplificar la escritura de un sistema. 
Asi, si consideramos las matrices 



el producto de matrices nos permite escribir el sistema de forma simple como 
Ax = b. 

El lector seguramente conocera el metodo de elimination habitualmente 
empleado para resolver sistemas lineales. El metodo esta basado en las siguientes 
propiedades: 



Se verifican las siguientes propiedades: 


(i) Si multiplicamos una ecuacion por un escalar distinto de cero, las solucio- 
nes de (2.1) no varfan. 

(n) Si intercambiamos dos ecuaciones en el sistema (2.1), las soluciones del 
mismo no cambian. 

(in) Si sustituimos una ecuacion por el resultado de sumar o restar dicha 
ecuacion con un multiplo de otra, las soluciones del sistema (2.1) no varfan. 


La demostracion es muy sencilla y se deja al lector. 

Estas propiedades nos permiten poner en marcha un metodo simple y directo 
para resolver sistemas lineales conocido como metodo de Gauss. 4 

4 Este metodo ya aparece en un libro de matematicas chino titulado Jiuzhang suanshu o 
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Metodo de Gauss 


El objetivo de este metodo es la transformacion del sistema original en uno 
mas facil de resolver mediante la aplicacion de las propiedades descritas en la 
Proposition 2.7. Lo veremos directamente a traves de un ejemplo. 


Resolver mediante el metodo de Gauss el siguiente sistema: 


x + 2y + 3z = 7 
x — 3y + 2z = 5 
x + y + z = 3 

Realizaremos las siguientes operaciones con las ecuaciones del sistema: 


x + 2y + 3z 
x — 3y + 2z 
x + y + z 


7 

5 

3 


2‘-l“ 


3 a —1‘ 
- > 


x + 2y + 3z 
-5 y - z 

-y - 2z 



l a <->2 a 
- > 


x + 2y + 3z 
-y ~ 2z 
-5 y - z 


7 ) x + 2y + 3z 

. I 5-2 a —3 a 

—4 > - > —y — 2z 

-2 J -9z 



En cada transformacion del sistema hemos usado alguna de las propiedades de 
la Proposition 2.7. En concrete, en la primera transformacion hemos sustituido 
la segunda ecuacion por la diferencia entre la segunda y la primera ecuacion, 
y luego hemos hecho lo propio entre la tercera y la primera. De esta forma 
hemos eliminado la variable x en las dos ultimas ecuaciones. En la segunda 
transformacion simplemente hemos intercambiado las ecuaciones segunda y 
tercera con objeto de simplificar el siguiente paso. Finalmente hemos llegado 
a un sistema en el que han desaparecido las dos primeras variables de la ultima 
ecuacion y la primera variable en la segunda ecuacion. El sistema resultante 
(denominado sistema triangular) es muy facil de resolver. Empezamos por 
resolver la ultima ecuacion (z = 2), y su valor lo sustituimos en la anterior, de 
rnanera que esta es tambien facil de resolver (y = 0). Sucesivamente, sustituimos 
los valores obtenidos en la ecuacion anterior para obtener la solution de la 
primera incognita (a: = 1). A este metodo de resolver un sistema triangular se 
le llama una subida. 


Nueve capitulos del arte matematico cuyo origen algunos historiadores marcan alrededor del 
ano 200 a.C. 
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Como hemos visto, el metodo de Gauss consiste en “triangular” el sistema 
dado de manera que pueda resolverse facilmente mediante una subida. Es 
importante observar que el papel de las incognitas es superfluo. Unicamente 
son necesarios los coeficientes de las misrnas en el sistema asf como el termino 
independiente, es decir, podemos trabajar facilmente con matrices, como vemos 
en el siguiente ejemplo. 


Resolver el sistema mediante el metodo de Gauss: 


a; + 3 y + z = —3 

3a; + 9y + 4z = —7 

2x — y + z = 6 

En forma matricial, 



Resolvemos mediante una subida y obtenemos 2 = 2, y = —2 y x = 1. La terna 
(1, —2, 2) es solution de este sistema. 

Es habitual marcar con una li'nea la separation entre la matriz de los co¬ 
eficientes del sistema y los terminos independientes. Por otra parte, notese que 
hemos operado con las ecuaciones a traves de las hlas de la matriz, conveniente- 
mente notadas como Fi. Es muy aconsejable anotar en cada paso las operaciones 
realizadas. 

Observese ademas que la matriz resultante es una matriz triangular superior. 


Matrices elementales 

Las operaciones llevadas a cabo en el metodo de Gauss se conocen como 
operaciones elementales y pueden ser interpretadas mediante multiplication de 
matrices elementales que definimos a continuation: 
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(i) Eij es la matriz que se obtiene de la identidad cuando intercambiamos la 
fila i con la fila j, es decir: 


/ 1 


Eij — 


\ 


0 ■■■ 1 


1 ■■■ 0 


V 


-Fila i 


-Fila j 


i 


(n) Ei(X) es la matriz obtenida al multiplicar la fila i por A en la matriz 
identidad, es decir: 


/ 1 


Ei( A) = 


\ 


V 


-Fila i 


i 


(ill) E^ (A) es la matriz obtenida de la matriz identidad al sumar a la fila j , la 
fila i previamente multiplicada por A, esto es: 


/ 1 


Col. i Col. j 

4 - 4 - 


Eij (A) = 


A 1 


-Fila i 


-Fila j 


17 
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El siguiente resultado nos dice como funciona el metodo de Gauss a traves 
de las operaciones con matrices elementales. 


Sea A € .M m xn(K) y sean E y F matrices elementales de orden m y 
n, respectivamente. Entonces el producto EA es la matriz que se obtiene de 
A cuando aplicamos a sus filas la misma transformacion que aplicamos a la 
identidad para obtener E. 

Analogamente, AF es la matriz que se obtiene de A cuando aplicamos a sus 
columnas la misma transformacion que aplicamos a la identidad para obtener 

F. 



Demostracion: 

Probemos solamente que el resultado es cierto para la matriz elemental E = 
Eij(X). El resto de las pruebas es similar y se deja al lector. 

En primer lugar observemos que si denotamos por eu los coeficientes de la 
matriz E, entonces 


eu 


{ 1 si k = l, 

A si k = j y l = i, 1 < k, l < m 
0 en el resto. 


La matriz producto EA tiene como elementos 


(EA)k p = ^2 ekiaip, 1 < k < m, 1 <p<n 
1=1 


Si k ^ j, el unico elemento eu con 1 < l < m no nulo es ekk (es decir, el unico 
elemento de la fila k no nulo es el de la diagonal), luego ( EA)k p = ak P ■ Esto es, 
todas las filas (salvo la j-esima) de la matriz producto son iguales a A. 

En la fila j, solo hay dos elementos no nulos, e Jt = A y ejj = 1, luego 

(. EA)j p = Xa ip + aj P , 1 < p < n 

luego la fila j-esima del producto EA corresponde a la suma de los elementos 
de la fila i de A multiplicados por A, mas los elementos de la fila j. Esto prueba 
el resultado. 
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Consideremos la matriz A = 



-13 4 


2 -1 -1 


2 1 0 



(i) Multipliquemos por la izquierda por la matriz E 3 ( 2): 


W) 



1 0 0 \ 

OIOJ =^E 3 (2)A 
0 0 2 / 



-13 4 


2 1 0 
4 -2 -2 



La operation realizada equivale a multiplicar por 2 la tercera fila de A. 
( 11 ) Multipliquemos a la izquierda por la matriz Ei 3 (— 2): 



El producto es equivalente a multiplicar por —2 la primera fila de A y 
sumarla a la tercera. 

(ill) Multipliquemos a la izquierda por la matriz 1?23 : 



El producto equivale a intercambiar entre si las filas segunda y tercera. 


El lector puede comprobar que sucede cuando las multiplicaciones se realizan 


a la derecha. 


Gracias a estas matrices elementales, es evidente que el metodo de Gauss 
no supone mas que la multiplicacion sucesiva de matrices elementales. Es por 
ello que ahora, mas que nunca, se hace indispensable anotar las operaciones 
realizadas entre las filas de la matriz, pues cada una de ellas corresponded a 
una multiplicacion por una matriz elemental. En la section 3.3.1 usaremos este 
hecho con mas detalle para resolver sistemas de una forma particular. 
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01 - 

CALCULO DE LA INVERSA MEDIANTE OPERACIONES ELEMENTALES 


En esta section vamos a usar el metodo de Gauss para calcular la matriz 
inversa de una matriz cuadrada. Comencemos con un ejemplo sencillo. 


Consideremos la matriz 


A = 


'2 V 
A 3, 


y calculemos su inversa. 

Para ello debemos buscar una matriz B £ A4 2X 2 tal que AB = J 2 . Si 
ponemos, 

X\ x 2 \ 


entonces 


AB = h 


/ 2 I s 
V 4 3, 


^3 x 4 ) 

l (xi x 2 
' \x 3 x 4 1 


1 O' 

.0 1 , 


lo cual equivale a resolver el sistema 


2x i + x 3 = 1 

2x 2 + x 3 = 0 

4x\ + 3 x 3 = 0 
4x 2 + 3^4 = 1 


Antes de resolver este sistema por el metodo de Gauss podemos observar que 
dicho sistema esta desacoplado , es decir, podemos resolver independientemente 
las ecuaciones primera y tercera, por un lado, y la segunda y la cuarta por otro. 
Resolviendo el primero de esto sistemas mediante Gauss se obtiene: 


( 2 

1 

1 ^ 

F 2 -2F lt 

( 2 

1 

V 4 

3 

0 ) 

' 

V 0 

1 


de donde x 3 = —2 y ii = despues de resolver mediante una subida. 
No obstante, existe una alternativa a la resolution mediante una subida para 
resolver el sistema: podemos diagonalizar la matriz de los coeficientes siguiendo 
el esquema descrito por el metodo de Gauss, es decir, haciendo ceros ahora por 
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encima de la diagonal principal: 



De hecho, hemos dado un pequeno paso mas; una vez diagonalizada la matriz 
hemos multiplicamos adecuadamente cada fila para que en la diagonal de la 
matriz de los coeficientes obtengamos un 1. De este modo se observa que el 
termino independiente muestra exactamente la solucion de sistema, mientras 
que la matriz de los coeficientes se ha transformado en la matriz identidad. Esta 
“extension” del metodo de Gauss es conocida como metodo de Gauss-Jacobi. 

Procedemos del mismo modo con el otro par de ecuaciones para encontrar 
X '2 y x 4 : 


2 1 
4 


0 

1 


F 2 -2Fi 


2 1 
0 1 


0 

1 



de donde deducimos que X 2 = — \ y £4 = 1. Asf pues, la inversa de A viene 
dada por 



No obstante, es interesante observar que los dos sistemas desacoplados, cuya 
solucion nos ha permitido obtener la matriz inversa, tienen la rnisrna matriz 
de coeficientes (igual a la matriz A), por lo que la aplicacion del metodo de 
Gauss-Jacobi realiza exactamente las misrnas operaciones en arnbos. Por tanto, 
es posible resolver ambos sistemas simultaneamente si escribimos juntos los dos 
terminos independientes: 


/ 2 1 1 0 
y 4 3 0 1 


F 2 ~2F2 
F1—F2 


1 0 
0 1 


3 

2 

-2 


1 

2 

1 


Vemos que la matriz de inicio esta formada por la “union” de la matriz A e I 2 , 
mientras que la matriz final esta formada por I 2 y A . Dicho de otro modo, 
las operaciones elementales que nos conducen desde la matriz A a la matriz 
identidad, son las que nos llevan desde la matriz identidad a A . 
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Como hemos podido ver en este ejemplo, el calculo de la inversa de una 
matriz A £ por el metodo de Gauss consiste en diagonalizar la matriz 

(A | I n ) hasta conseguir la identidad mediante transformaciones elementales. 
La matriz resultante en la derecha es la inversa de la dada. 


Encontrar la inversa de la matriz 


A = 



Escribimos la matriz junto con la identidad de orden 3: 


A = 


1 

to 

0 

1 

0 

0 \ 

fl 

2 

0 

1 

0 

0 

0 

1 

3 

0 

1 

0 I 

0 

1 

3 

0 

1 

0 

2 

-1 

-8 

0 

0 

1 / ' 

v° 

-5 

-8 

-2 

0 

1 


F3 + 5F2 


1 

to 

0 

1 

0 

0 

/ 1 

2 

0 

1 

0 

0 

0 

1 

3 

0 

1 

0 ' 

^ 0 

1 

3 

0 

1 

0 

0 

0 

7 

-2 

5 


V° 

0 

1 

2 

7 

5 

7 

1 

7 


F2 — 3F3 


/ 1 2 0 

1 0 0 \ 

(010 

6 8 3 1 

7 7 7 

\ 0 0 1 

2 5 1/ 

7 7 7 / 


F!-2F 2 


/too 

5 16 6 \ 

7 7 7 \ 

(010 

6 8 3 

7 7 7 

1—1 

0 

0 

2 5 1 / 

7 7 7 / 


Luego, 


A -1 = 


16 

7 


El lector puede comprobar que en efecto A A 1 = I 3 . 
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Calcular la inversa de 



Procediendo como en el ejemplo anterior: 


/ 2 4 1 0 
\ 3 6 0 1 



1 2 | i 0 
3 6 I 0 1 


F 2 -3Fi 


1 2 | I o\ 
0 0 I-I 1 ) 


Podemos observar en este caso que no hay forma alguna de obtener la matriz 
identidad mediante transformaciones elementales de A. Esto significa que no 
existe A■. 


En definitiva, mediante el metodo de Gauss tenemos un rnetodo para, 
mediante operaciones elementales, obtener una matriz triangular superior. Si 
los elementos diagonales de esta matriz son todos distintos de cero, es posible 
realizar nuevas operaciones que nos conduzcan a una matriz diagonal, y por 
tanto, aplicando (i) de la Proposition 2.7 llegar a la matriz identidad mediante 
operaciones elementales. 

Puesto que la aplicacion de operaciones elementales equivalen a multiplicar 
por matrices elementales, podemos escribir: 

E k ■ ■ ■ E 2 E 1 A = I =$> A= {E k ■ ■ ■ E 2 E 1 )~ 1 = E- l E- y ■ ■ ■ E~ x 

donde E k , ..., E k son las matrices elementales correspondientes a las operacio¬ 
nes realizadas. Por ejemplo, en el ejemplo 2.11, las matrices elementales usadas 
son: 

E x = E 13 (- 2), E 2 = E 23 ( 5), E 3 = £7 3 (i), E 4 = E 32 (- 3), E 5 = E 21 (- 2) 


Es facil demostrar que las matrices elementales son invertibles, y su inversa 
es un matriz elemental. 5 De este modo se tiene el siguiente resultado. 



Una matriz es invertible si y solo si es producto de matrices elementales. 


s Basta observar que para llegar a la identidad desde una matriz elemental debemos realizar 
la operation elemental “inversa”. 
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Como ya hemos visto, la definition del producto de matrices nos permite ver 
el sistema (2.1) en forma matricial como Ax = b. Si resulta que este sistema 
es cuadrado , esto es, tiene el mismo numero de ecuaciones que de incognitas 
(m = n), y ademas la matriz de los coeficientes es invertible, multiplicando 
por A -1 a la izquierda obtenemos A -1 Ax = A _1 b. Puesto que A -1 A = I n e 
I n x = x, se sigue que x = A _1 b. 


1 D - 

DETERM IN ANTE DE UNA MATRIZ 

El concepto de determinante 6 se va a definir de manera inductiva. Para 
una vision general del metodo de induction matematica, que sera usado con 
frecuencia en las demostraciones de esta section, nos remitimos al apendice A. 
Comenzaremos con un par de definiciones previas. 



Se denomina submatriz de una matriz A £ Af mX n(K) dada, a cualquier ma¬ 
triz obtenida de A eliminando un conjunto determinado de bias y/o columnas. 



Se denomina matriz adjunta del elemento ij de una matriz A , y se denotara 
por A,j , a la submatriz obtenida al eliminar la fila i y la colunma j de dicha 
matriz. 


Notese que la matriz adjunta de un elemento cualquiera tiene siempre un 
orden rnenos que la matriz initial (vease la figura 2.2). 


6 Los determinantes aparecen con anterioridad a las matrices. El de orden dos ya aparece en 
la obra de Cardano en 1545, en relacion con la solucion de sistemas lineales de dos ecuaciones 
con dos incognitas. Los de orden superior aparecen casi simultaneamente en las obras del 
japones Kowa Seki y el aleman Gottfried Wilhelm von Leibniz alrededor del ano 1680. Pero 
es el trances Augustin Louis Cauchy el que en 1812 comienza a usar los determinantes en el 
sentido actual, probando varias de sus propiedades. 
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T 


A = 


UTl -<T 

a 21 a. 


dm 1 O y i 2 


-Wn 

02 n 


A 22 — 


Oil 

Ol3 • 

■ • n 

031 

033 • 

■ • a 3n 

Oml 

Om3 ■ 

■ • ^ran 


Figura 2.2: Matriz adjunta del elemento 2 2 



Sea A £ .M„(IK). Se define el determinante de A , que denotaremos por det A 
6 | A |, del siguiente modo: 


■ Si n = 1, |A| = an. 

■ Si n > 1, 

n 

I A | = an|.Aii| — 021 1 A 21 1 + • • • + (—1)™ +I a n i|j4 n i| = ^(-l)- +1 o,i \An \ 

i =1 

donde \An\ es el determinante de la matriz adjunta del elemento i 1, que 
corresponde a una matriz cuadrada de orden n — 1. 


Veamos como desarrollar la definition de determinante en los casos n = 2 y 
n = 3: 

, , _ . f On 012 \ 

( 1 ) Si 71 = 2, A = , entonces 

\o 2 i 022 / 

|A| = dn | An | — O 21 IA 21 I = Ond22 — O 21 O 12 



dll O 12 Oi3 

021 022 023 | > entonces 

031 032 033 

= oii|An| — d2i|A 2 i| + 03i|A 3 i| = 



022 

023 


012 

013 

+ O31 

Ol2 

Ol3 

Oil 

032 

033 

- «21 

032 

033 

O22 

a 23 



— Ond22d33 — 0nd32023 — 021012033 + 021032013 


+031012023 — 031022013 
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Figura 2.3: Formulas para los determinantes de orden dos y tres 


Como se puede observar, el determinante de una matriz es un nurnero que 
se calcula mediante sumas y productos de sus coeficientes. El determinante de 
una matriz de orden dos tiene una expresion facil de recordar, pues se trata 
de calcular el producto de los elementos de la diagonal principal y restarle el 
producto de los elementos de la diagonal opuesta (vease la figura 2.3a) 

Sin embargo, para el determinante de orden tres aparecen seis productos, 
que dificultan la memorization de la formula que proporciona su valor. No 
obstante, existe una sencilla regia mnemotecnica para recordar la expresion del 
determinante de una matriz de orden tres, la conocida como regia de Sarrus 7 
que nos indica cuales son los productos con signo positivo y cuales los de signo 
negativo (vease la figura 2.3b). 

Es importante resaltar que estas reglas (que parecen tener un cierto parecido) 
no son extensibles a determinantes de orden superior. En particular, jla regia de 
Sarrus solo es valida para determinantes de orden tres! Por otra parte, aunque la 
regia tiene un cierto “encanto” que la hace muy popular entre los estudiantes, 
veremos mas adelante que es preferible calcular determinantes de orden tres 
empleando alguna de las propiedades que siguen. A1 fin y al cabo, la regia 
de Sarrus obliga al calculo de seis productos, que pueden hacerse un tanto 
engorrosos. 

El resto de la section esta dedicada a presentar una serie de propiedades que 
nos permitiran simplificar el calculo de determinantes. 


' Introducida por el matematico trances Pierre Frederic Sarrus en 1833. 
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QQH Propiedades de los determinantes 



Si una matriz cuadrada A tiene una fila completa de ceros, entonces su 
determinante es nulo. 


Demostracion: 

Procederemos por induccion en el orden de la matriz. Si n = 1 el resultado 
es evidente. Supongamos ahora que el resultado es cierto para las matrices de 
orden n — 1, y probemoslo para orden n. Supongamos ademas que la fila j-esima 
es nula, es decir ciji = ■ ■ ■ = aj n = 0. Entonces, por definition, 

n 

W = £(- 1 ) <+1 °i 1 |^il 

«=i 

Ahora bien, cada matriz An tiene orden n—1 (pues es la adjunta de una matriz 
de orden n ) y todas, salvo Aj\, tienen una fila completa de ceros. Por hipotesis 
de induccion, \An \ = 0 \/i ^ j. Luego 

n 

\A\ = 5>l) i+1 tii|^i| = (-l) i+1 «til^il 
*=i 

pero este ultimo sumando tambien es nulo, pues a,j i = 0 (ya que esta en la fila 
j); de aquf se tiene el resultado. 


Proposition 2.10 


Se verifica: 


an 

0\ n 


an 

0\ n 


Oil 

^ In 

a il + bn 

Oin H - bin 

= 

til • 

Oin 

+ 

bn 

bin 

Onl 

Onn 


®nl 



®nl 

O-nn 


Demostracion: 

Nuevamente procedemos por induccion en n. A1 igual que antes, para n = 1 el 
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resultado es trivial. Supongamos ahora el resultado cierto para el orden n-ly 
probemoslo para n. Denotaremos por C a la rnatriz del primer miembro de la 
igualdad en (2.2) y por A y B a las de la derecha, respectivamente. Queremos 
probar que \C\ = |A| + \B\. 

Por definicion, 

\C\ = cni|Cn| + • • • + (—l) i+1 (aii + ba)\Ca\ + • • • + (—l) ri+ 1 a ra i|C n i| 

observemos ahora que cada matriz Cj 1 con j ^ i es de orden n-ly mantiene 
la nrisma estructura que C, por tanto podemos usar la hipotesis de induccion y 
asegurar que \Cji \ = |vlji| + si j ^ i. Asi pues, 

\C\ = an(|An| + |Bn|) + • • • + (—iy +1 (aji + feii) | Cal 

+ • • • + (—l) n+1 a„i(|A nl | + |B„i|) 

Finalmente, basta observar que Cn = An = Bn (pues todas las matrices tienen 
las mismas filas excepto la i-esima) y aplicar la definicion de determinante para 
obtener lo deseado. 



Si B es la matriz obtenida al multiplicar los elementos de una fila de la 
matriz A por un escalar A £ K, entonces \B\ = A|A|. 


Demostracion: 

Nuevamente el resultado es trivial para n = 1. Para probar el caso n, supuesto 
que se satisface el caso n — 1, vemos que si 



an 

n 


Oil 

n 

A = 



entonces B = 

Aaa 

Xain 


&nl 

^nn 


dnl 

^nn 


Por tanto, 

\B\ = ail \B n \ + • • • + (-l) i+ 1 Aaa|Ba| + • ■ • + (~l) n+ 1 a nl \B nl \ 


Como en la demostracion anterior, cada matriz Bj i, con j i, tiene orden 
n — 1 y la misma estructura que B. Por hipotesis de induccion, \Bj\\ = A|Aji|. 
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Por otra parte, esta claro que Bn = An, asf piles, sustituyendo en la ecuacion 
anterior 


\B\ — anA|j4n| + • • • + (— iy +1 Xan\An | + • • • + (—l) n+1 a n \\\A n i\ — A|A| 


Proposition 2.12 


Si B es la matriz que se obtiene de A intercambiando dos de sus filas, entonces 
\B\ = ~\A\. 


Demostracion: 

Como antes, procederemos por induccion en el orden de la matriz. Comenzamos 
probando el caso n = 2 (pues el caso n = 1 no adquiere significado en esta 
situation). Es claro que 


an 

021 


«12 

022 


= 011022 ^ 012021 = — (021012 — 011022) = 


021 

022 

Oil 

012 


Para probar el caso n, supuesto que se verifica el caso n — 1, empezaremos 
probando que el resultado es cierto si intercambiamos dos filas consecutivas. 

Sea A = ( aij ) y sea B la matriz obtenida al intercambiar dos filas consecu¬ 
tivas, i — 1 e i. Entonces: 


B = 


Oil 

Oil 

Oj-1,1 

Onl 


Oln 

Oin 
Oj—1 ■ 


-Fila i — 1 
- Fila i 


Usando la definicion de determinante, 


\B\ — aii|Bii|+- • •+(—l) I aii|5i_i j i|+(—l) I+1 a,;_i j i|l?ii|-|-- • •+(—l) n,+1 a n i|J3 n i| 

( 2 - 3) 

Ahora usamos la hipotesis de induccion en cada matriz Bji, j ^ i — l,i. Puesto 
que son matrices de orden n—l obtenidas al intercambiar dos filas consecutivas 
de las correspondientes matrices Aj\, entonces \Bji \ = — \Aji\, si j ^ i — 1, i. 

Por otro lado, es facil darse cuenta que Bi _ii = An y que Bn = Aj-ip. 
Finalmente, sustituyendo en (2.3) 
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\B\ — — aii|-An| 4- • • • + (—Vf an\An\ + (— 

+ • • • + (—l) n+1 a ral |A ral | = —\A\ 

Para probar el caso general, es decir, cuando intercambiamos dos filas no 
necesariamente consecutivas, es suficiente observar que el intercambio de la fila 
i con la fila j equivale a realizar 2k — 1 cambios consecutivos, donde k = \i — j\. 
Por tanto, el signo se altera 2k — 1 veces, que al ser un numero impar, supone 
un cambio de signo en el valor del determinante. 



Si una matriz tiene dos filas iguales su determinante es nulo. 


Demostracion: 

La demostracion es consecuencia inmediata de la proposition anterior, puesto 
que si intercambiamos dos filas iguales, el determinante de la matriz debe 
cambiar de signo, aunque la matriz es la misma, por lo que \A\ = — |A| => 

14 = 0 . 

■ 

El siguiente resultado es consecuencia de las proposiciones anteriores y jugara 
un papel fundamental en el calculo de determinantes. 


Proposition 2.14 


Si B es la matriz obtenida de A al sumar a una fila de A , un multiplo de 
otra fila de la matriz, entonces \B\ = |ti|. 


Demostracion: 

En efecto, si B es de la forma especificada en el enunciado: 


an 

^1 n 

a ji 

O'jn 

Un + Xaji 

& in H - Xaj n 

Unl 
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podemos hacer uso de las Proposiciones 2.10 y 2.11 para descomponer el deter¬ 
minante del siguiente modo: 



an 

n 


an 

0\n 

B\ = 


P 

... 

S 

+ A 

a n 

Ojn 


Oil 

0*171 


dji 

Ojn 


®nl 

Onn 


^ril 

Onn 


y este ultimo determinante es nulo puesto que tiene dos filas iguales. 

■ 

Notese que la transformation efectuada en esta proposition es una de las 
transformaciones tfpicas que se llevan a cabo en el metodo de Gauss, y que no 
altera el valor del determinante. 

El resultado que sigue a continuation nos da un caracterizacion inmediata 
de las matrices regulares, esto es, las que poseen inversa. 


Proposition 2.15 


A es una matriz regular si y solo si \A\ ^ 0. 


Demostracion: 

Observemos en primer lugar que las Proposiciones 2.11, 2.12 y 2.14 afirman 
que los determinantes de las matrices elementales son \Eij\ = —1, |Ej(A)| = A 
y \Eij(\)\ = 1, pues tales matrices ban sido obtenidas de la identidad mediante 
las operaciones senaladas en los resultados mencionados, y es facil ver que el 
determinante de la matriz identidad (de cualquier orden) es 1. Por tanto, se 
deduce que 

det(EA4) = det(E) det(ti) 

para cualquier matriz elemental E y cualquier matriz A. Luego 

det(Ei • • • E k A) = det(Ed) • • • det (E k ) det(ti) 

para cualesquiera matrices elementales E\, ..., Ek. Como por el Teorema 2.2, 
A es regular si y solo si es producto de matrices elementales, es decir, A = 
E[ ■ ■ ■ E' k , se tendra que 

det(ti) = det(£’( • • • E' k ) = det(i?() • • • det (E' k ) ^ 0 
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Proposition 2.16 


Si A, B e A4„(K) entonces det(AB) = det(i) det(U). 


Demostracion: 

Si det(ti) =06 det(-B) = 0 entonces A 6 B es singular, y por tanto tambien lo 
es AB (vease Proposition 2.6), luego det(ti-B) = 0 (por la Proposition 2.15). 

Si det(A) y det(U) no son nulos, ambas son matrices invertibles y por tanto 
seran producto de matrices elementales. La demostracion de la Proposition 2.15 
nos da el resultado. 


Proposition 2.17 


det(.A) = det(i T ) 


La prueba de este resultado sigue la misma idea que la de la Proposition 2.16 
y se deja al lector (ejercicio 27). 



Como consecuencia de este ultimo resultado, las proposiciones 2.9-2.14, que 
enuncian propiedades por filas, pueden ser tambien enunciadas por columnas. 


Finalmente, usando la nota 2.3 y la proposition 2.12 se tiene el siguiente 
resultado: 
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En definitiva, podemos desarrollar el determinante mediante los adjuntos de 
cualquier fila o columna. 

En el siguiente ejemplo veremos como aplicar algunas de las propiedades 
anteriores para obtener el valor de los determinantes. 


Calcular el valor de los siguientes determinantes: 


3 

5 

1 


2 

4 

1 


15 

25 

5 

(n) 

7 

5 

2 

(m) 

1 

0 

7 


11 

13 

4 



2 

6 

10 

14 


3 

4 

7 

8 

11 

12 

15 

16 


(i) Observemos que 


3 

5 

1 


3 

5 

1 

15 

25 

5 

= 5- 

3 

5 

1 

1 

0 

7 


1 

0 

7 


donde hemos aplicado la Proposition 2.11 a la segunda fila y luego la 
Proposition 2.13 a las filas uno y dos. En consecuencia, es inmediato 
observar que si una matriz tiene una fila (o columna) multiplo de otra, 
entonces su determinante es cero. 


(n) Si aplicamos la Proposicion 2.14 a las filas dos y tres, 


2 

4 

1 


2 

4 

1 

7 

5 

2 

F3—F2 

7 

5 

2 

11 

13 

4 


4 

8 

2 


vemos que el determinante resultante tiene las filas una y dos proporcio- 
nales, luego por el comentario anterior el determinante es nulo. 

(ill) Aplicando la Proposition 2.14 obtenemos un determinante con dos colum- 
nas iguales, 


1 

2 

3 

4 


1 

1 

3 

1 

5 

6 

7 

8 

C2—C1 

C4-C3 

5 

1 

7 

1 

9 

10 

11 

12 


9 

1 

11 

1 

13 

14 

15 

16 


13 

1 

15 

1 
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En todos los casos anteriores hemos llegado a determinantes que tienen dos 
filas o columnas identicas, lo que hace que el valor del determinante sea nulo. 
Obviamente, eso no va a ocurrir en general, pero en ocasiones nrerece la pena 
perder un poco de tiernpo realizando operaciones sencillas en el determinante 
para ver si es posible obtener este hecho. Cuando esto no ocurre, la mejor forma 
de calcular un determinante es seguir los pasos que comentamos en el siguiente 
ejemplo. 



Calcular el valor del determinante: 


-14 3-2 

-3105 
2 1-1 3 

2 111 


En lugar de proceder directamente desarrollando por una fila o colunma haremos 
uso de los resultados anteriores (esencialmente la Proposition 2.14) a fin de 
lograr el mayor numero de ceros en una misma fila o columna, de rnanera que al 
usar el Teorema 2.3, tengamos un numero elevado de sumandos que quedaran 
multiplicados por cero. Asi pues, trataremos de hacer ceros en la tercera columna 
(pues ya hay uno y los calculos son mas sencillos): 


-1 

4 

3 

-2 

F3+F4 

-7 

1 

0 

-5 

-3 

1 

0 

5 

F1 — 3F4 

-3 

1 

0 

5 

2 

1 

-1 

3 


4 

2 

0 

4 

2 

1 

1 

1 


2 

1 

1 

1 


desarrollando por la tercera columna 


7 

1 

-5 

F2—F1 

F 3 - 2 Fi 

-7 

1 

-5 

3 

1 

5 

= 

4 

0 

10 

4 

2 

4 


18 

0 

14 



4 

10 


2 

5 

= 



= 2-2 




18 

14 


9 

7 


= - 124 . 
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Es muy importante observar que en todas las transformaciones que hemos 
realizado en el ejemplo anterior, la fila o columna que transformamos no se 
multiplica por ningun numero, pues de hacerlo, el determinante quedaria mul- 
tiplicado por dicho numero. 


En las dos siguientes secciones usaremos el calculo de determinantes para 
obtener el rango de una matriz y su matriz inversa. 


□ a - 

RANGO DE UNA MATRIZ 


Una de las principals aplicaciones de los determinantes reside en el calculo 
de rangos, 8 que sera de mucha utilidad a lo largo de todo este texto. Es por ello 
que el metodo que vamos a ver en esta section adquiere especial importancia. 



Se denomina menor de orden k de una matriz A G A / l mX nQK) al determi¬ 
nante de una submatriz cuadrada de A de orden k. 



Se llama rango de una matriz A G -M mxrl (K) al mayor orden de entre todos 
los menores de A no nulos. 


Es decir, si rango(A) = r, toda submatriz cuadrada de A de orden mayor que 
r tiene determinante nulo, y al menos existe una submatriz cuadrada de orden 
r con determinante no nulo. Notese que es inmediato que si A G _M mX n(lK) 
entonces rango(ti) < min {m, n} 



El rango de una matriz no se altera si: 


(i) Intercambiamos entre si dos filas (o dos columnas). 


Definido por primera vez por el matematico aleman Ferdinand Georg Frobenius en 1878. 
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(n) Trasponemos una fila con una columna (esto es, intercambiar la fila i con 
la columna i). 

(ill) Multiplicamos los elementos de una fila (o columna) por un escalar distinto 
de cero. 

(iv) Sumamos a una fila (o columna) los elementos de otra fila (o columna) 
multiplicados por un escalar. 


La demostracion de este resultado se deduce directamente de las propiedades 
de los determinantes. 

Calculo del rango de una matriz: metodo del orlado. 

La definition de rango nos indica una forma de proceder con su calculo: en- 
contrar el mayor orden de entre todos los menores no nulos. Para ello, podrfamos 
considerar todos los menores de una matriz y calcular sus determinantes, sin 
embargo, el siguiente metodo, conocido como metodo del orlado , nos proporcio- 
na un procedimiento en el que no es necesario obtener todos los menores de la 
matriz. 

En primer lugar denominaremos menor basico a cualquier menor distinto de 
cero. A las filas y columnas de A que conforman ese menor se les denomina filas 
y columnas basicas. 

Para calcular el rango de una matriz se procede como sigue: 

(i) Se suprimen todas las filas o columnas completamente nulas. Si todas las 
filas de una matriz son nulas entonces rango(A) = 0. 

(il) Tomamos una fila donde exista un menor de orden uno no nulo. La fila y 
columna correspondientes a ese menor se consideran como basicas. 9 

(ill) Orlamos , esto es, afiadimos a la fila y columna basicas una nueva fila y 
una nueva columna, para forrnar un menor de orden dos. Si este menor es 
nulo, orlamos con la misma fila y una nueva columna, hasta encontrar un 
menor de orden dos distinto de cero. 

Si todos los menores de orden dos obtenidos al orlar con la misma fila y 
todas las posibles columnas son nulos, podemos eliminar la fila en cuestion 
(puesto que no aporta rango a la matriz), y proceder con la siguiente, 
repitiendo el mismo procedimiento. 

9 Obviamente, si se considera cualquier otro menor de orden uno distinto de cero, las filas 
y columnas basicas serfan otras. El procedimiento que lleva a cabo el metodo del orlado no es 
linico. 
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(iv) Una vez encontrado un menor de orden dos distinto de cero, considera- 
mos como basicas las filas y columnas que la componen y orlamos para 
encontrar un menor de orden tres no nulo, repitiendo el procedimiento 
anterior. 

(v) Si al orlar un menor de orden k con todas las filas y columnas disponibles 
no encontramos un menor de orden k + 1 distinto de cero, entonces 
rango(A) = k. 


Calcular el rango de la matriz 


A = 


/0 

0 

0 

0 

1 

Vi 


1 

-3 

2 


0 0 

1 1 

-1 1 


3 \ 

1 

-4 

0 

1 

1 ) 


£ M 


6x5l 


Esta claro que el rango maxirno de esta matriz es 5, puesto que no es posible 
construir un menor de orden 6. Puesto que la cuarta fila es completa de ceros, 
podemos eliminarla y proseguir sin ella. En la matriz resultante buscamos un 
menor de orden uno distinto de cero; por ejemplo, el formado por la fila 1, 
columna 2, que a partir de ahora, son consideradas basicas. 


(0 0 
0 -3 
0 2 
1 1 

V 1 - 1 


1 

4 

-5 

1 

1 


3\ 

1 

-4 

1 

V 


£ M 


5x5i 


Orlamos este menor hasta encontrar uno distinto de cero. Es facil ver que orlando 
con la segunda fila y la cuarta columna, el menor 


1 1 

-3 4 


7^0 


Las filas basicas son ahora {1, 2}, y las columnas basicas {2,4}. A continuation 
orlamos con la tercera fila y la quinta columna (es inmediato ver que, orlando 
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con la primera o la tercera columna no podemos conseguir un menor distinto de 
cero). El menor 


1 

-3 

2 


1 

4 

-5 


3 

1 

-4 


= 0 


De este modo, orlando con la tercera fila no hay forma de obtener un menor 
distinto de cero, por lo que podemos eliminar dicha fila. 

Orlamos con la cuarta fila y la columna primera; el menor 


0 

0 

1 


1 

-3 

1 


1 

4 

1 


^0 


Luego las filas basicas son ahora {1, 2,4} y las columnas basicas {1, 2,4}. 
Orlamos con la quinta fila y la tercera columna, 


0 

0 

1 

1 


1 0 
-3 0 
1 1 
-1 1 


1 

4 

1 

1 


= 0 


Por tanto podemos eliminar la columna tercera. Finalmente, orlando con la 
quinta columna: 


0 

0 

1 

1 


1 1 
-3 4 
1 1 
-1 1 


3 

1 

1 

1 


7^0 


Puesto que no quedan mas filas por orlar, el rango(A) = 4. 

Es importante resaltar que, en todo el procedimiento, una vez que consegui- 
mos un menor basico de un cierto orden, no lo perdemos, es decir, a la hora 
de buscar menores basicos de orden superior usamos siempre el menor que ya 
tenemos completandolo con mas filas y columnas, esto es, orlandolo. 


Calculo del rango mediante el metodo de Gauss 

Existe una alternativa para el calculo del rango de una matriz usando el 
metodo de Gauss descrito en la seccion 2.3. Dado que las operaciones involu- 
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cradas en el metodo de Gauss no modifican el rango (como consecuencia de las 
propiedades de los determinantes), para realizar este calculo procedemos a trian¬ 
gular la matriz del mismo modo que hacemos con un sistema, es decir, haciendo 
nulos todos los elementos que quedan por debajo de la diagonal principal. El 
rango de la matriz resultara igual al niimero de filas no nulas que resulten tras 
la triangulacion. 



Calcular el rango de la matriz 


fl 

6 

11 

16\ 

2 

7 

12 

17 

3 

8 

13 

18 

4 

9 

14 

19 

l 5 

10 

15 

20/ 


Triangulamos mediante el metodo de Gauss, haciendo ceros en la primera 
columna por debajo de la primera fila, y luego haciendo ceros en la segunda 
columna, por debajo de la segunda fila 


fl 

6 

11 

16^ 

F 2 -2F ± 

F 3 -3Fi 

2 

7 

12 

17 

F i -4F 1 

3 

8 

13 

18 

F 5 —5Fi 

4 

9 

14 

19 


V 5 

10 

15 

20 J 



fl 

6 

11 

16\ 

0 

-5 

-10 

-15 

0 

-10 

-20 

-30 

0 

-15 

-30 

-45 

V° 

-20 

-40 

—60/ 



Fs- 

-2F 2 



Fi- 

-3F 2 



Fs- 

-4 F 2 




6 11 16\ 

-5 -10 -15 

0 0 0 

0 0 0 

0 0 0 / 


Dado que la matriz obtenida es triangular y que el numero de filas no nulas es 
dos, el rango de la matriz A es 2. 
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i a - 

APLICACION DE LOS DETERMINANTES AL CALCULO DE LA INVERSA 


Finalmente, veamos como se usan los determinantes para calendar la inversa 
de una matriz. 



Dada una matriz cuadrada A, se denomina adjunta de una matriz (o matriz 
de cofactores) de A a la matriz adj(A) £ _M„(K) dada por 

(adj^ = (—iy+^-1 


Es decir, la adjunta de una matriz es una nueva matriz en la que cada 
elemento ij es igual al cleterminante de la matriz adjunta de ese elemento, 
multiplicada por (—, es decir, con un determinado signo, que dependera de 
la “posicion” de ese elemento. A partir de la matriz de cofactores se obtiene la 
inversa de una matriz, segun muestra el siguiente resultado. 


Teorema 2.5 (Inversa de una matriz) 


Sea A £ Alr^K) una matriz invertible. Entonces 


1 


• 4 "=d<h“« A > T 


Demostracion: 

Denotemos por Cij = (adj(A)).y. Entonces, 


a n 


«ln \ / cn 


Cnl 


Aadj(A) r = 




K C-lr. 


= 


^ ^ cijkCjk 
k =1 
n 

(Aadj(A) ^ ^ ^ikC-jk 


k =1 


si j = i 
si j 7^ i 
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Ahora bien, por la definition de la adjunta y el Teorema 2.3 

n n 

(Aadj(A) T )^ = aj k Cj k = '^(—l) J+k (ijk\ A jk\ = \A\ (2.4) 

fc =i fc=l 

Por otra parte, si B es la matriz siguiente, en la que las filas i y j son iguales, 


B = 


an 

• ’ ’ din 

an 


aii 

^in 

V a^ i 

Q'nn) 


-Fila i 


-Fila j 


y desarrollamos su determinante por la fila j, entonces 

n 

i^i = 'y ' QikCjk ~ n 

fe=i 

pues B tiene dos filas iguales. De (2.4) y (2.5) se sigue el resultado. 


(2.5) 



Observese que el resultado anterior solo tiene sentido si |A| ^ 0, que es, 
precisamente, la condition de no singularidad obtenida en la Proposition 2.15. 



Calcular la inversa de la matriz 


( 1 2 

A= —1 1 2 

V ° 1 v 

En primer lugar calculamos |A| = 7. Puesto que este no es cero, procedemos a 
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an - 

CALCULO CON PYTHON 

En este tema hemos introducido las matrices, con las que vamos a realizar 
multitud de calculos a lo largo de todo el texto, y en esta seccion nos centraremos 
en mostrar como se pueden llevar a cabo con Python. No obstante, insistimos 
encarecidamente en la importancia que tiene saber hacer realizar todas estas 
operaciones “a mano”, sin necesidad de usar el ordenador. 

En el apendice B introdujimos los modulos NumPy y SymPy, gracias a los 
cuales es posible trabajar facilmente con matrices: 

1 >>> from numpy import matrix 

2 >>> a=matrix(’l. 2 ; 3 4’) 

a >>> a 

4 matrix([[ 1. , 2. ] , 

5 [ 3., 4.]]) 


Las operaciones mas comunes se realizan de forma natural: por ejemplo: 

A >W3 e\ h A 

\3 4/ ^9 12 J V 3 4 / V 1 4 / \4 8/ 

(l 2\ /3 2\ _ / 5 10\ /l 2\ 2 _ / 7 10\ 

\3 4 J \1 4 J ~ \13 22 J \3 A) ~ ^15 22J 

se pueden realizar con el siguiente codigo: 
e >>> b=matrix(’3. 2; 1 4’) 
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7 

>>> 3* a 



8 

matrix( [ [ 

3. 

6.] , 

9 

[ 

9 . 

12.]]) 

10 

>>> a+b 



11 

matrix ( [ [ 

4. , 

4.] , 

12 

[ 

4. , 

8.]] ) 

13 

>>> a*b 



14 

matrix ([[ 

5 . 

10.] , 

15 

[ 

13. 

22.]] ) 

16 

>>> a**2 



17 

matrix ( [ [ 

7. 

10.] , 

18 

[ 

15. 

22.]] ) 


Tambien tenemos atributos sencillos con los que construir la matriz tras- 
puesta y la inversa: 


>>> a . T 

matrix([[ 1., 

3.] , 

[ 2. , 

4.]]) 

>>> a . I 

matrix( [ [-2. , 

1. ] , 

[ 1.5 , 

-0.5]] ) 


es decir, 



Recordemos que el modulo NumPy trabaja con numeros reales, por lo que 
en determinados momentos nos encontraremos con resultados como estos: 


25 

>>> c=matrix(’l 1; 4 

1’) 

26 

>>> c . I 


27 

matrix( [ [-0.33333333 

0.33333333] , 

28 

[ 1.33333333 

-0.33333333]]) 


Si queremos calculos exactos, debemos usar el modulo SymPy: 


29 

>>> 

from sympy import Matrix 

30 

>>> 

C = Matrix ( c) 

31 

>>> 

C.inv ( ) 

32 

[-1/3, 1/3] 

33 

[ 4/3, -1/3] 


Notese que la funcion para definir matrices en SymPy no es la misma que en 
NumPy (Python es sensible a las mayusculas). En la lfnea 30, usamos la funcion 
Matrix para convertir una matriz de NumPy en una de SymPy. El calculo de la 
matriz inversa ahora no es posible con el atributo I, pues no esta definido para 
objetos de SymPy. Es por eso que debemos usar el metodo inv() (lfnea 31). 
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El orden de la matriz se obtiene a traves del atributo shape, y el acceso 
a las filas o columnas de la matriz se obtiene rapidamente mediante slicing , 
recordando que los indices en Python comienzan en 0: 



El operador de slicing proporciona el entorno adecuado para realizar las 
operaciones involucradas en el metodo de Gauss: el siguiente codigo 





Observese que hemos trabajado con el objeto de SymPy para obtener resul- 
tados exactos, aunque tambien se podrian haber realizado los calculos con el 
objeto de Nurnpy. 

El slicing tambien es util para extraer submatrices de una matriz: 

54 

55 


56 


>>> A 

[ 1 , 2 , 0 , 1 ] 
[ 1 , 1 , 2 , 0 ] 
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57 

[l. 

o, 

2, 

1] 

58 

>>> 

B = 

A [ : 

1-1 

CO 

o 

59 

>>> 

B 



60 

[l , 

2 , 

0] 


61 

[l , 

1, 

2] 


62 

[l , 

0 , 

2] 


63 

>>> 

c= 

A [: 

,3] 

64 

>>> 

c 



65 

[l] 




66 

[0] 




67 

[i] 





Prestar atencion al manejo de los indices en Python. La operation A [: ,0:3] 
extrae las tres primeras columnas de A (es decir, hace variar el segundo indice 
entre 0 y 3, sin llegar a este ultimo). 


Los modulos NumPy y SymPy tambien permiten calcular el determinante 
de matrices cuadradas, pero cada uno lo hace de forma distinta: 


>>> 

from numpy 

import 

linalg 

,matrix 

>>> 

from sympy 

import 

Matrix 



>>> 

a=matrix (’ 

135; 231; 

-1 

1 1>) 

>>> 

b=Matrix([ 

[2,5,1] 

[2,1,- 

1] 

[0 , -2,2]] ) 

>>> 

1inalg.det 

(a) 




18.0 






>>> 

b.det () 





-24 







1 

3 

5 


2 

5 

1 

2 

3 

1 

= 18 

2 

1 

-1 

-1 

1 

1 


0 

-2 

2 


Lamentablemente, ninguno de los dos modulos posee una funcion para 
calcular el rango de una matriz de forma directa, aunque se puede obtener por 
otros medios. En concreto, en SymPy encontramos el metodo rref () que nos 
proporciona el rango de una matriz de forma indirecta. Este metodo equivale 
a realizar operaciones elementales en la matriz similares a las hechas en el 
ejemplo 2.10 (es decir, tratando de “diagonalizar” la matriz mediante el metodo 
de Gauss). Por ejemplo, 


9 

>>> 

a=Matr ix 

([[1,6,11,16] , [2,7,12,17] , 

10 

[3,8,13,18] , 

[4,9,14,19] , [5,10,15,20]]) 

11 

>>> 

a.rref () 


12 

([1 

0, -l, 

-2] 

13 

[0, 

1 , 2 , 

3] 

14 

[0, 

0 , 0 , 

0] 

15 

[0, 

0 , 0 , 

0] 
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[ 0 , 0 , 0 , 0 ] , [ 0 , 1 ]) 


equivale a 


1 

6 

11 

16 1 


1 

0 

-1 

—2' 

2 

7 

12 

17 


0 

1 

2 

3 

3 

8 

13 

18 

—► 

0 

0 

0 

0 

4 

9 

14 

19 


0 

0 

0 

0 

\5 

10 

15 

20 / 


lo 

0 

0 

0/ 


Observamos que el resultado de esta operation nos da una matriz que primero 
ha sido triangulada mediante el metodo de Gauss (como en el ejemplo 2.16), 
y posteriormente se han calculado ceros sobre la diagonal principal y se han 
hecho unos en la diagonal, alii donde esto ha sido posible (es decir, algo similar 
al metodo de Gauss-Jacobi). Dado que esta matriz tiene dos filas no nulas, su 
rango es dos. 


Bill - 

BREVE INTRODUCCION A LA TEORIA DE GRAFOS 

La teoria de grafos es una rama de las Matematicas que ha recibido gran 
atencion debido a sus multiples aplicaciones en campos tan variados como la 
Ingenien'a, la Fisica, la Psicologia o la Sociologia, entre otros. Tiene su origen en 
el problema de los siete puentes de Konigsberg, 10 que fue resuelto por Euler en 
1736, y que consistia en averiguar si es posible dar un paseo por todos los puentes 
que conectan la ciudad con la isla que forma el rio Pregolya al atravesarla, de 
manera que se cruce cada puente una sola vez y se vuelva al punto de partida 
(vease la figura 2.4a). 

Este problema admite una representation esquematica en forma de grafo. Un 
grafo es un objeto formado por un conjunto de puntos denominados vertices y 
un conjunto de pares de vertices llamados aristas. Esquematicamente un grafo 
se representa por una grafica como la de la figura 2.4b, que corresponde al 
esquema de conexiones en el problema de los puentes de Konigsberg. En este 
ejemplo, cada vertice representa cada una de las zonas terrestres que quedan 
divididas por el rio, y las aristas corresponden a los puentes que las conectan. 
La information que nos proporciona el grafico es la de las conexiones entre sus 
vertices: por ejemplo, el vertice v% esta conectado con el V 2 mediante dos aristas, 
y con el V 4 solo mediante una. Como podemos apreciar, en lo que se refiere al 
problema, la information del grafo es equivalente a la del mapa que muestra la 
situation de los puentes. 

Podemos representar la information que proporciona este grafo mediante una 
matriz, denominada matriz de adyacencia que nos da el numero de conexiones 
en el grafo, de tal modo que el elemento de la matriz es igual al numero 


10 Actual Kaliningrado. 
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(a) Mapa de Konigsberg en la epoca de Euler con (b) Grafo que representa el problema 
la situation de los puentes 



Figura 2.4: El problema de los siete puentes de Konigsberg 


de aristas que conecta el vertice i con el vertice j. De este modo, la matriz del 
grafo de la figura 2.4b es 



2 0 
0 2 
2 0 
1 1 



( 2 . 6 ) 


Las sucesivas potencias de la matriz de adyacencia de un grafo tienen un 
significado peculiar. Por ejemplo, para la matriz A de (2.6) se tiene que 


B = A 2 



1 5 
9 1 
1 5 
4 2 



^Que significa que el elemento b 12 = 1, o que 614 = 4? En este caso, el hecho de 
que 612 = 1 significa que hay un unico camino de longitud 2 (es decir, que se ha 
de recorrer en dos etapas) que une el vertice v\ con 1)2 (el que une v\ —> V 4 —> i> 2 , 
vease la figura 2.5); es lo que se denomina un 2 -camino. Que 624 = 4 significa 
que podemos unir los vertices v± y V 4 mediante 2 -caminos de cuatro modos 
diferentes. ^Puede el lector encontrarlos? 

En definitiva, la entrada bij de la matriz B = A 2 nos da el numero de 2- 
caminos que unen los vertices Vi con Vj. El significado de los sucesivas potencias 
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Figura 2.5: Camino v\ —► V 4 —> V 2 


de A es analogo: las entradas de la potencia n de A nos proporcionan el numero 
de n-caminos que unen los correspondientes vertices. 


Los grafos tambien pueden ser dirigidos. Por ejemplo, supongamos que 
tenemos una serie de lugares (vertices) unidos por caminos (aristas) pero que 
alguno de estos solo puede ser recorrido en una unica direction (vease la 
figura 2.6a). La matriz de adyacencia en este caso serfa 


C = 


(0 

1 

1 

0 

V 1 


1 0 1 o\ 
0 0 10 
0 0 0 1 
0 10 1 
0 10 0 / 


que, a diferencia del ejemplo anterior, no es simetrica 

La potencia n de esta matriz tambien nos proporciona el numero de n- 
caminos que conectan el vertice i con el j, pero en este caso, respetando la 
direccionalidad. Por ejemplo, 


C 2 


/l 0 1 1 l\ 

0 1111 
11110 
2 0 10 1 
yl 1 0 1 \) 


Notese que hay dos 2-caminos que unen el vertice V 4 con tq, pero solo un 2- 
camino que une v\ con U 4 . 
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V2 



(a) Grafo dirigido (b) Grafo no conexo 


Figura 2.6: Grafos 


En todo grafo de k vertices, esta claro que cualquier trayectoria que una un 
vertice Vi con Vj tendra como maximo longitud k — 1, de manera que si A es su 
matriz de adyacencia se verifica que la matriz 

A + A 2 H-b A k ~ x 


tiene un cero en la position ij si y solo si no existe ninguna trayectoria (de 
cualquier longitud) que una el vertice Vi con el Vj. 

Por ejemplo, la matriz de adyacencia del grafo de la figura 2.6b es 


D = 


(° 

0 

1 

0 

v° 


0 1 0 o\ 
0 10 0 
10 0 0 
0 0 0 1 
0 0 1 Oy 


Es evidente que en ese grafo no hay forma de llegar desde los vertices Vi, V 2 
6 V 3 hasta los vertices tq 6 v§, hecho que se puede comprobar calculando las 
posiciones de los ceros de la matriz 


/3 3 3 0 0\ 

3 3 3 0 0 

3 3 6 0 0 

0 0 0 2 2 

^0 0 0 2 2y 


D + D 2 + D 3 + D 4 
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Estamos ante lo que se denomina un grafo no conexo, 11 pues hay pares de 
vertices que no se pueden unir mediante ninguna trayectoria, lo que queda 
reflejado por la matriz anterior. 


B EB 


EJERCICIOS 


Ejercicios de repaso 

I ail Los precios en euros de las entradas a un parque tematico para adultos 
(AD) y niiios y jubilados (NJ) en temporada alta (TA), temporada media (TM) 
y temporada baja (TB) vienen dados por la matriz P. El numero de asistentes 
(en miles) a dicho parque a lo largo de un ano viene dado por la matriz N: 


AD NJ 


TA TM TR 
20 

15 




Se pide: 


(a) Obtener, si es posible, las matrices: R\ = NP y i ?2 = PN. 

(b) lA cuantos euros asciende la recaudacion total correspondiente a los nirios 
y jubilados? lY la correspondiente a temporada baja? 

(c) iQue elemento de i?i o R -2 nos proporciona informacion sobre la recauda¬ 
cion total correspondiente a los adultos? 

(d) iA cuantos euros asciende la recaudacion total? 



Si A = 



, calcular A T B, B T A 1 AB T y BA T . 



Realizar las siguientes operaciones: 


A + 2B-, %A - 5B; AB ; BA: AB ; 


donde 



11 Intuitivamente, el concepto de conexidad significa que el grafo puede ser separado en 
subgrafos que no estan conectados por ninguna arista. 
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I at! Escribir los siguientes sistemas en forma matricial y resolverlos mediante 
el metodo de Gauss: 


2x + 3 y + z = — 1 
(a) 3x + 3y + z = 1 

2x + Ay + z = —2 


Xi — 2 x 2 — X 3 = 0 

(b) 3x\ — 5 x 2 — 2 x 3 = 5 

3 a:i + X2 — 2x3 = 2 


|33 Encontrar la inversa de las siguientes matrices usando el metodo de 
Gauss: 


(a) 





I am Escribir las matrices del ejercicio 5 como producto de matrices elemen- 
tales. 

I aM Calcular el rango de las siguientes matrices: 


(a) 



3 

-5 

-2 



(b) 



3 1 
2 1 
3 0 
2 0 



I am Demostrar, sin necesidad de calcularlos, que los siguientes determinantes 
son nulos: 


(a) 


1 

2 

3 

4 

5 


2 

3 

4 

5 

6 


3 4 5 

4 5 6 

5 6 7 

6 7 8 

7 8 9 



42 

5 2 

6 2 

7 2 


Problemas 

|2J Hallar la rnatriz cuadrada de segundo orden que expresa la suma A' 2 +E 2 , 
siendo X e Y dos matrices, tambien de segundo orden, que satisfacen el sistema: 


5X + 3Y = A 
3X + 2Y = B 
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donde A = 


2 01 - 1 . 

-4 15 J \-2 9 ) 

2| Calcular todas las matrices de orden dos tales que: 

(a) su cuadrado sea la matriz nula; 

(b) sean idempotentes, es decir, A 2 = A. 

Hallar todas las matrices B £ .M 2 O&) que conmutan con la matriz 

-5 2/ 


A = 


QB Encontrar la inversa de las siguientes matrices usando el metodo de 
Gauss: 


1 

1 

1 

1 

1 


1 

-2 

0 

0 • 

• 0 

0 

1 

1 

1 

1 


0 

1 

-1 

0 • 

• 0 

0 

0 

1 

1 

1 

(b) 

0 

0 

1 

-1 • 

• 0 

0 

0 

0 

1 

1 







0 

0 

0 

0 

1 


0 

0 

0 

0 • 

• 1 


* iaiKl Sabiendo que los numeros 58786, 30628, 80743, 12831 y 16016, son 
multiplos de 13, probar que el siguiente determinante tambien lo es: 

5 8 7 8 6 

3 0 6 2 8 

1 2 8 3 1 

8 0 7 4 3 

16 0 16 


* ia>El Demostrar que el conocido como determinante de Vandermonde 12 tiene 
por valor: 


1 

1 

1 

1 


Xi 

X2 

%3 

X n 


X 2 

A 

x\ 

■ X 2 

■*'n 

= n ~ Xi ) 






x i~ 1 

A- 1 

x-- 1 • 

1 



1 “Denominado asi por el matematico trances Alexandre Vandermonde. Aunque hizo in- 
teresantes contribuciones al estudio de los determinantes, este en concreto no aparece en sus 
trabajos. Se cree que la atribucion es debida a cierta confusion con la notacion que empleaba. 
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Sugerencia: aplicar el principle) de induction y realizar las siguientes operaciones: 
Fj+i - x-n+iFj, para j = 1 ,..., n. 

QJ3 Evaluar los siguientes determinantes: 


(a) 


1 

1 

1 


2 

x +1 
2 


3 

3 

x + 1 


n 

n 

n 


12 3 ar+1 



1 

2 

3 

n — 

i 

n 







1 

3 

3 

n — 

i 

n 


1 

n 

n 

• n 

(b) 

1 

2 

5 

n — 

i 

n 

(c) 

n 

2 

n • 

• n 


1 

2 

3 

• • • 2 n — 

3 

n 


n 

n 

n • 

• n 


1 

2 

3 

n — 

1 

2n — 1 







* 33 Probar que: 


X + aq 

02 


03 



On 


Oi 

x + a 2 

03 



On 

= *"- 1 (* + E?=i 

o-l 

a 2 


a 3 



X + a n 




2 

1 

0 

0 

... o 




1 

2 

1 

0 

... o 



(b) 

0 

1 

2 

1 

... 0 

= n + 1 



0 

0 

0 

0 

••• 2 



3Q Encontrar el rango de la matrices 


(a) 



(b) 




1 + a 2 I 

2 -f- 2 a J 


segun los valores de a. 
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Halla el rango de la matriz 



1 

1 

l + i 


en funcion de los valores ay b. 

*|3£] Hallar la inversa de la siguiente matriz 


1+x 1 1 ••• 1 

1 1 + x 1 ••• 1 

1 1 1 + x ••• 1 


1 1 1 1+x 


Ejercicios teoricos 

I awn Sea A £ M mxn { K), y Sean Fi £ M\ xm y Cj £ A4 nx i las matrices fila 
y columna respectivamente, cuyos elementos son todos nulos salvo un 1 en la 
position 1 i de Fi y jl de Cj. Calcular los productos FiA y ACj. 

law Sean A, B £ _Ad„(IK) dos matrices simetricas. Probar que AB es simetri- 
ca si y solo si A y B conmutan. 

|2£] Probar que si A £ _Ad„(IK) es una matriz simetrica, entonces A k es 
simetrica para todo k £ N. 

I2£| Si A es una matriz regular, probar que A es simetrica si y solo si A _1 
es simetrica. 

|2£| Se dice que A £ Ad„(IK) es antisimetrica si A = —A T . Probar que dada 
cualquier matriz cuadrada M £ Ad n (K), M — M T es una matriz antisimetrica. 
Usar este hecho para demostrar que cualquier matriz cuadrada se puede escribir 
como suma de una matriz simetrica y otra antisimetrica. 

|2£] Sean A £ una matriz regular tal que AB = 0, donde B £ 

•Mnxp(l&)- Probar que B = 0. 

|2£] Una matriz A £ se dice nilpotente si existe k £ N tal que 

A k = 0. Probar que si A es nilpotente, entonces I — A es invertible y su inversa 
es 

(/ - A)~ x = I + A + A 2 H-b A k ~ 1 


|2U Probar la Proposition 2.17. 
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Ejercicios adicionales 


Dada la matriz 


A = 


/o 1 
1 0 
0 1 
1 0 
VO 1 


1 0 l\ 
0 1 0 
0 0 0 
1 0 1 
1 1 0 j 


dibujar el grafo que representa a dicha matriz y averiguar, usando Python, el 
numero de 3-caminos que conectan los vertices iq y 1^3 del mismo. 

HW !1 Dado el grafo 



escribir su matriz de adyacencia y usar Python para averiguar si existe algun 
vertice no alcanzable. 









3 Sistemas de ecuaciones lineales 


En el tema anterior se introdujeron los sistemas de ecuaciones lineales como 
una de las aplicaciones habituales de las matrices y en este vamos a recordar 
resultados, como la Regia de Cramer o el Teorema de Rouche-Frobenius, que 
el lector habra tenido la oportunidad de ver en cursos anteriores. Tambien 
introduciremos algunos aspectos nuevos relacionados con el Algebra Lineal 
Numerica, estudiando algunos metodos computational disefiados para resolver 
sistemas de ecuaciones. Veremos como usar Python tanto en la resolution 
de sistemas como en la programacion de metodos numericos y finalizaremos 
mostrando una aplicacion del uso de sistemas lineales en la resolution de 
ecuaciones diferenciales ordinarias. 


Hi - 

SISTEMAS DE ECUACIONES LINEALES: PRIMERAS DEFINICIONES 


Recordemos que un sistema de ecuaciones lineal es una expresion de la forma 


anxi + 0120:2 H-h a ln x n = &i 

a 2 i.Ti + a 2 2®2 H-b a 2n x n = b 2 

> 


(3.1) 


dm \X\ + a m2 x 2 + ■ ■ ■ + 

Q'mri'En 


b 


m 


en el que los elementos que intervienen ya aparecieron en la Definition 2.9. 
El concepto de solution dado en la Definition 2.10, junto con la definition de 
compatibilidad que presentamos a continuation, conforman practicamente todos 
los elementos necesarios para trabajar con sistemas de ecuaciones lineales. 



Un sistema se dice compatible si posee solution, e incompatible si no posee 
solution. Un sistema compatible se dice determinado si su solution es unica. En 
caso contrario se dira indeterminado. 


91 
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La Proposition 2.7 permite poner en marcha el metodo de Gauss, que ya 
hemos visto en el tema anterior (pag. 49), y que recordamos con nuevos ejemplos: 



Resolver mediante el metodo de Gauss los siguientes sistemas: 

(I) 

Xi - x 2 + x 3 = 1 

xi + x 2 + x 3 = 0 

2aq — 2 x 2 + 2x 3 = 3 

Recordemos que el metodo de Gauss consiste en triangular el sistema 
mediante transformaciones entre sus ecuaciones que lleven a un sistema 
equivalente que se resuelve mediante una sencillo proceso de subida. Re- 
escribiendo el sistema en forma matricial, las operaciones conducentes a 
la triangulacion son, en este caso, 


1 

-1 

1 


F 2 — F 1 I 

1 

1 

1 

0 

F 3 - 2 F 1 1 

2 

-2 

2 

3 V 

\ 



Si ahora reescribimos el sistema resulta que la ultima ecuacion se escribe 
0 = 1!!! Se trata por tanto de un sistema incompatible. 


(II) 

x\ + 3 x 2 — x 3 + X 4 
— 2 x! + x 2 + 2x 3 
x 2 — X4 

2 x\ + 6x 2 — 2x 3 + 2x 4 
El metodo de Gauss resulta ahora: 


1 

7 

0 

2 




f 

V 


1 

-2 

0 

2 


3 -1 
1 2 
1 0 
6 -2 


1 

0 

-1 

2 


1 

7 

0 

2 


F2+2F1 

F i -2F 1 


13-1 1 

0 7 0 2 

0 1 0-1 
0 0 0 0 



Podemos ver que la ultima ecuacion es 0 = 0, con lo que no aporta informa¬ 
tion alguna al sistema y podemos eliminarla. Finalmente, intercambiando 
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las filas segunda y tercera para simplificar los calculos, se tiene 


/ 1 3 -1 ill 
101 0-10 
yo 7 0 2)9 


/ 1 3 -1 1 

(01 0-1 

\ 0 0 0 9 


1 

0 

9 


con lo que el sistema queda triangulado. En este caso, al realizar el proceso 
de subida obtenemos X 4 = 1 , X 2 = 1 , sin embargo la primera ecuacion 
resulta x\ = X 3 — 3. Puesto que tenemos mas incognitas que ecuaciones, 
X 3 queda libre para tomar el valor que uno desee, obteniendose asf un 
valor para x\. Puesto que X 3 puede tomar infinitos valores, estamos ante 
un sistema compatible indeterminado. Un conjunto de soluciones puede 
expresarse por (a —3,1, a, 1) con a £ R. Como solo tenemos una incognita 
libre (a la que se denomina parametro) se dice que el sistema tiene un grado 
de libertad. Notese que el numero de grados de libertad es la diferencia 
entre incognitas y numero de ecuaciones relevantes, esto es, ecuaciones 
que no resultan eliminadas en el transcurso de la aplicacion del metodo 
de Gauss. 


(in) 

X\ — X2 + 2X3 — X4 = 1 

—Xi + 2x 2 — X3 — X4 = —2 
3xi — 4x2 + 5x3 — X 4 = 4 

Observemos que este sistema no puede ser determinado, puesto que tene¬ 
mos mas incognitas que ecuaciones. Procediendo como antes, 


/ 1-1 2-1 

-1 2-1 -1 
\ 3 -4 5-1 

Si a la fila tres le sumamos la fila dos (observese que tienen signos opuestos) 
la tercera ecuacion resulta irrelevante, de manera que llegamos a un 
sistema triangular de dos ecuaciones con cuatro incognitas, tratandose por 
tanto de un sistema compatible indeterminado. En este caso tenemos dos 
grados de libertad, lo cual significa que las soluciones del sistema quedan 
determinadas escogiendo dos parametros; en este caso dejamos libres X 3 y 
X4. La solution general puede expresarse como 



(—3a + 3/3, — 1 — a + 2(3, a, /3), a,/3eK 
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En definitiva, hemos visto a traves de ejemplos como el metodo de Gauss es 
capar de reflcjar el caracter de un sistema, es decir, si es o no compatible, y el 
niimero de grados de libertad que posee. 

A continuation vamos a centrarnos en un tipo de sistemas que jugara un 
papel muy relevante a lo largo del texto. 

Sistemas Homogeneos 



Un sistema de la forma (3.1) se dira homogeneo , si el termino independiente 
bi = 0, para todo i = 1 ,..., m. 


Es inmediato comprobar que todo sistema homogeneo es compatible, pues la 
n-upla (0 ,..., 0) es solution del mismo (comunmente denominada solution tri¬ 
vial). Por otra parte, la aplicacion del metodo de Gauss a un sistema homogeneo 
basta realizarla sobre la rnatriz de los coeficientes, puesto que la columna co- 
rrespondiente al termino independiente se mantiene siempre nula. Si despues 
de la triangulacion por Gauss y la posterior elimination de filas nulas la rnatriz 
resultante es cuadrada (es decir, el niimero de grados de libertad del sistema es 
cero), el sistema es compatible determinado, y su unica solution es la trivial. 
En otro caso, el sistema sera compatible indeterminado. 


Dado el sistema homogeneo 


dll x l "i" &12 x 2 ’ ’ ' &ln x n — 0 
a 21 x l + a 22 x 2 + ’ ’ ’ Cl2n x n = 0 

> 


(3.2) 


®ml^l ^m2^2 * * * &mn%n — 0 


si (aii,... ,a; n ) es solution, entonces (ax\,... , ax n ) tambien es solution del 
sistema, Va £ R. 

Del mismo modo, si (x±,..., x n ) e (yi,---,y n ) son soluciones de (3.2), 
entonces la n-upla [x\ + yi,... ,x n + y n ) tambien es solucion de (3.2). 


La demostracion de este resultado es trivial y se deja como ejercicio al lector. 
Observese que la tesis del resultado es cierta con independence de que el sistema 
sea o no determinado. 












3.1 ■ Sistemas de ecuaciones lineales: primeras definiciones 


Las soluciones de un sistema homogeneo son relevantes en relation con las 
soluciones de uno no homogeneo, corno pone de manifiesto el siguiente resultado. 



Si (xi,...,x n ) es solucion del sistema (3.1), entonces todas sus restantes so¬ 
luciones se escriben de la forma (x\ + an,..., x n + a n ), donde (ai,..., a ra ) es 
solucion de (3.2), su sistema homogeneo asociado. 


Demostracion: 

Si (x\,... ,x' n ) es cualquier otra solucion de (3.1) entonces podemos escribir 

(x'i, ...,x' n ) = (x 1 ,...,x n ) + (x[ - xi,..., x' n - x n ) 

Si ahora ponemos (on,... , a n ) = (x[ — xi ,... , x' n —x n ), es inmediato comprobar 
que esta n-upla es solucion de (3.2). De manera que hemos podido escribir 
cualquier solucion del sistema no homogeneo como suma de una solucion dada, la 
que se conoce como solucion particular , mas una solucion del sistema homogeneo 
asociado. 


Como consecuencia de este resultado podemos afirmar que si el sistema (3.1) 
es compatible, entonces tiene tantas soluciones como su correspondiente sistema 
homogeneo (3.2). 



Consideremos el sistema (ill) del ejemplo 3.1. Su sistema homogeneo asociado 
es 

X\ — X2 + 2.X3 — X4 = 0 

— X\ + 2 X 2 — X3 — X\ = 0 

3xi — 4x2 + 5x3 — Xi = 0 

Si resolvemos el sistema homogeneo mediante el metodo de Gauss obtendremos 
como solucion general: (—3a + 3/3, —a + 2/3, a, j3). 

Imaginemos ahora que conocemos una solucion particular del sistema no 
homogeneo, por ejemplo (0,—1,0,0). Como llegamos a conocer esta solucion 
particular no es relevante aquf; supongamos que, simplemente, la conocemos. 
Entonces, segun afirma la proposition 3.2 la solucion del sistema no homogeneo 
es 

(0, -1,0,0) + (-3a + 3/3, -a + 2/3, a, /3) 
que obviamente coincide con la obtenida en el ejemplo 3.1. 
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Regia de Cramer 

La regia de Cramer 1 * nos da la solution directa de un sistema cuadrado 
compatible determinado mediante el calculo de ciertos determinantes. Tiene su 
utilidad pues nos proporciona una expresion cerrada de la solution del sistema, 
aunque en la practica no es muy util cuando el sistema es grande pues obliga al 
calculo de determinantes de tamafio excesivo. 


Teorema 3.1 (Regia de Cramer) 


Si A € A / 1„(K) es regular y x, b G At nx i(IK), el sistema Ax = b es 
compatible determinado y 

\Aj\ „ . 

xi = w - 3 - n 

donde Aj es la matriz 


A? — 


an 


, «n 1 * * * b n 


air. 


es decir, la matriz obtenida de A al sustituir la columna j por el segundo 
miembro del sistema. 


Demostracion: 

Como se vio en la nota 2.2, como A es regular, la solution de Ax = b es 
x = A~ 1 b. Usando el Teorema 2.5, x = py adj(A) T b. Siguiendo con la notation 
empleada en la demostracion del Teorema 2.5, el producto matricial anterior 
puede escribirse por 


frlCll + • • ■ + b n Ci ri 


\A\ 


blCni + • • • + b n C n 


Es decir, 


Xj — {biCji + • • • + b n Cj n ), 


expresion que coincide con jjp desarrollado por la j-esima columna. 


1 Debe su nombre al matematico suizo Gabriel Cramer que la publico y popularizo en 1750, 

aunque el result ado ya habfa sido publicado dos anos antes por el escoces Colin Maclaurin. 
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Resolver el siguiente sistema: 


2xi + 3a;2 
%i + x 3 

2X2 — %4 
Xi + X4 


En este caso, 


A = 



b = 



Desarrollando el determinante de A por la tercera columna obtenemos 


I4=- 


2 3 0 
0 2-1 
1 0 1 


= -1 


Puesto que \A\ ^ 0 el sistema tiene solution unica. Calculando los determinantes 
de las correspondientes matrices Aj, 1 < j < 4 se tiene, 


l^i| = 


8 3 0 
1 0 1 
1 2 0 
4 0 0 




2 8 

1 1 


0 
1 

0 1 0 
1 4 


0 


1^31 = 


2 3 8 

1 0 1 


0 2 
1 0 


0 

0 

-1 

1 

0 

0 

-1 

1 

0 

0 

-1 

1 


8 3 0 

1 2 -1 
4 0 1 


2 8 0 
0 1 -1 
1 4 1 


= -1 


C3-C1 


2 3 6 
1 0 0 
0 2 1 
1 0 3 


= -2 


0 

0 

-1 

1 



3 

6 

0 

1 

II 

2 

1 

T - 1 


0 

3 

1 


= 0 
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1^1 


2 3 0 8 
10 11 
0 2 0 1 
10 0 4 


2 3 8 
0 2 1 
1 0 4 


-3 


Por tanto, aq = 1, oq = 2, * 3 = 0 y X 4 = 3. 


II - 

TEOREMA DE ROUCHE-FROBENIUS 


Teorema 3.2 (Teorema de Rouche-Frobenius 2 ) 


Consideremos el sistema lineal Ax = b, con A £ -A4 mx »(K), x £ _A/J„ x i(lK) 
y b £ Al mx i(K). Denotemos por A a la matriz ampliada del sistema, esto es la 
matriz formada por A junto con el segundo miembro b. Entonces, el sistema es 
compatible si y solo si rango(ti) = rango(A). 

Mas aun, el sistema sera determinado si rango(ti) = n (n° de incognitas) e 
indeterminado si rango(ti) < n. 


Notese ademas, que el numero de grados de libertad del sistema vendra dado 
por n — rango(ti). 

Demostracion: 

Por el momento solo probaremos que la condition es necesaria. La prueba de la 
suficiencia la posponemos hasta el tema siguiente (cf. nota 4.1). 

Si el sistema es compatible, entonces deben existir escalares X \,..., x n £ K 
tales que Ax = b, donde, como es evidente, (x),; = Xi. Consideremos ahora la 
matriz ampliada A £ A4 TOX („_)_i) (la ultima columna corresponde a la matriz 
b), y sobre ella efectuamos la operation entre columnas siguiente: 

C n +1 

2 El nombre se debe al matematico trances Eugene Rouche, que lo enuncio en 1875 y a 
Frobenius. Poco despues de su publicacion, el trances Georges Fontene se atribuyo la primera 
demostracion del mismo, y Frobenius, en 1905, acredito la demostracion a Rouche y Fontene. 
Sin embargo, el nombre por el que se conoce el resultado (especialmente en los parses de 
habla hispana) se debe al matematico hispano-argentino Julio Rey Pastor, que lo refirio de tal 
forma. En otros pafses es conocido como Teorema de Rouche-Fontene o Teorema de Kronecker- 
Capelli. 
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Dicha operation da como resultado la matriz 



y por la aplicacion sucesiva de (iv) del Teorema 2.4 se tiene que rango(A) = 
rango(M), que trivialmente es igual al rango(ti). 


Discutir la compatibilidad del siguiente sistema mediante el Teorema de 
Rouche-Frobenius. 

x\ + 2x 2 = 1 

2xi + X 2 + 3x3 = 2 

3xi + X 2 + 5x3 = 3 
La matriz ampliada se escribe, 


A = 



2 

0 

i\ 

2 

1 

3 

2 


1 

5 

3 / 


Es facil comprobar que rango(A) = 2, pues 


1 2 
2 1 


7^0 y 


12 0 

2 1 3 

3 1 5 


= 0 


y rango(A) = 2, pues 


= 0. 3 


1 2 1 
2 1 2 
3 1 3 

Por tanto se trata de un sistema compatible indeterminado (rango(A) < n° de 
incognitas). 

Es importante prestar atencion a la resolution de este tipo de sistemas. 
Puesto que rango(A) = 2, esto nos indica que solo dos ecuaciones y dos 
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incognitas son relevantes en la resolucion del sistema, y por tanto el niimero de 
grados do libertad es uno (es decir, el niimero de incognitas menos el niimero de 
ecuaciones relevantes). Por otra parte, ^cuales de estas incognitas y ecuaciones 
son las relevantes? La respuesta nos la da el menor basico: es decir, las ecuaciones 
e incognitas asociadas a las filas y columnas del menor basico; en este caso, las 
dos primeras ecuaciones y las dos prinreras incognitas. 

Para resolver el sistema, consideramos el resto de incognitas como parame- 
tros, esto es 

X\ + 2X2 = 1 

2x’i + X ’2 = 2 — 3a 

donde hemos puesto X 3 = a. Ahora tenenros un sistema cuadrado cuya matriz 
de coeficientes tiene determinante no nulo (ya que se trata del menor basico), 
asf pues podemos usar Cramer en su resolucion obteniendo: 


14 =-3, l^r| = 


1 2 
2- 3a 1 


= 6 a — 3, |A 2 | = 


1 1 
2 2-3a 


= —3a 


Luego las soluciones del sistema vienen dadas por (1 — 2a, a, a). 


Discutir el sistema 

ax + 2z = 2 

5x + 2 y = 1 

x — 2 y + bz = 3 


en funcion de los valores de a y b y resolverlo cuando sea compatible indetermi- 
nado. 


,! N6tese que no es necesario comprobar el valor del determinante 

1 0 1 
13 2 

15 3 


puesto que no esta formado a partir de filas y columnas basicas. 
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La matriz de coeficientes y la matriz ampliada del sistema son 


5 2 0 

\ 1 -2 6 


( 


a 0 2 



a 0 2 2 


5 2 0 1 

1—263 



Para estudiar el rango de A vemos que las dos primeras filas y las dos ultimas 
columnas conforman un menor de orden dos distinto de cero (con independencia 
de los valores de a y 6), de modo que al menos el rango de A es dos. Estudiando 


a 0 2 

\A\ = 5 2 0 = 2a6- 24 

1-2 6 


observamos que los valores de a y 6 que hacen que |j4| = 0 son los que 
verifican ab = 12. En conclusion, si ab = 12, rango(^4) = 2 y en caso contrario 
rango(A) = 3. 

Veamos ahora que pasa con A: obviamente, si ab ^ 12, como A no puede 
tener rango cuatro, rango(A) = 3 y el sistema sera compatible determinado. 
Nos resta por ver que pasa si ab = 12. Orlando el menor de orden dos de A con 
la ultima columna de A, 


0 2 2 

2 0 1 = 46 - 16 
-2 6 3 


De modo que, si 6 = 4 (y como ab = 12 eso significa que a = 3), entonces 


rango(A) = 2 y el sistema es compatible indeterminado. Si 6 ^ 4, (y ab = 12) 
el sistema es incompatible. Resumiendo 


I 


ab ^ 12 sistema compatible determinado 
6 = 4, a = 3 sistema compatible indeterminado 
en otro caso sistema incompatible 


Resolvamos ahora para a = 3 y 6 = 4. Consideramos el menor de orden dos 
escogido previamente y usamos la incognita correspondiente a la columna que 
no aporta rango como parametro (en este caso la primera, o sea, la variable x)\ 
pasando los parametros al segundo miembro, 


2z = 2 — 3a 
2 y = 1 — 5a 


La solution es (a, 


1 — 5a 2—3a; 
2 ’ 2 


)• 
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mm - 

ALGEBRA LINEAL NUMERICA 

Es muy frecuente que un gran niimero de problemas matematicos prove- 
nientes de diversos campos precisen, en algiin momento de su resolucion, tener 
que tratar con sistemas lineales con un gran niimero de ecuaciones e incognitas. 
El tamafio de tales sistemas los vuelve imposibles de resolver a rnano, por lo 
que es necesario acudir a algoritmos numericos programados en un ordenador 
para obtener su solucion. El Algebra Lineal Numerica se encarga de estudiar y 
analizar metodos para resolver estos sistemas computacionalmente. 

Basicamente se distinguen dos tipos de metodos: directos e indirectos. Los 
primeros tratan de obtener la solucion del sistema tras un niimero finito de 
pasos, mientras que los segundos construyen una sucesion de valores que van 
convergiendo a la solucion del sistema. Antes de pasar a describir algoritmos de 
ambos metodos hemos de prestar atencion a la forma en la que los ordenadores 
trabajan con los mimeros, pues es crucial en determinados aspectos de los 
metodos numericos. 


Errores de redondeo 


Los ordenadores trabajan con la denominada aritmetica de coma flotante en 
la que cada niimero es representado en la maquina de una forma determinada 
que permite almacenar mimeros reales extremadamente grandes y pequenos 
de forma compacta. Para nosotros, lo mas importante de este hecho es que 
las maquinas tienen que trabajar con un niimero limitado de cifras decimales. 
Por ejemplo, una computadora no puede 4 tratar con el niimero | = 2.6, pues 
dependiendo del numero de cifras significativas que maneje la maquina, el 
niimero se almacenara solo con una cantidad finita de cifras, lo cual induce 
un determinado error. Estos errores se pueden producir, bien por truncamiento , 
es decir, en lugar de considerar | consideramos 2.6666, (si nuestra maquina 
considerara solo cuatro cifras significativas) truncando la expansion decimal, o 
bien por redondeo , en el que almacenarfamos el digito de cuatro cifras decimales 
mas proximo al numero en cuestion, es decir, en este caso almacenarfamos 
2.6667. En ambos casos hablamos de errores de redondeo. 

Si bien los errores de redondeo no parecen ser importantes, mas aun cuando el 
numero de cifras significativas con el que trabaja una computadora actualmente 
se sitiia en 16 6 32, hay que tener cuidado con los mismos pues pueden aparecer 
diferencias notables. Por ejemplo, si calculamos exactamente los valores 


1 

2.6666 


= 15000, 


1 

| - 2.6667 


-30000 


4 Esto no es totalmente cierto: hemos visto como el modulo SymPy de Python permite 
trabajar con mimeros como si fueran simbolos, y por tanto es posible realizar ciertos calculos 
de forma exact a. 
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jla diferencia entre ambos valores es de 45000! (es lo que se denomina el error 
absoluto , que corresponde al valor absoluto de la diferencia entre los valores). En 
este caso, tal disparidad de valores se debe al hecho de que los denominadores 
de las fracciones calculadas son muy pequenos. En tales casos, una pequena 
diferencia de valores en los denominadores provoca diferencias enormes en los 
resultados. Uno de los retos del Algebra Lineal Numerica consiste en el diserio 
metodos que reduzcan en la medida de lo posible los errores generados por el 
redondeo, asi corno tratar de estimar estos errores cuando ocurren. 

Medir el error cometido mediante los errores absolutos hace que perdamos 
perspectiva. Por ejemplo, si estamos midiendo la longitud de un tornillo cuyo 
valor real es de 5 mm., y el aparato de medicion nos proporciona 4 mm. estamos 
cometiendo un error absoluto de 1 mm. Si la medicion es la de un campo de futbol 
que tiene 100 m. de largo, y nuestra medicion es de 99 m. estaremos cometiendo 
un error absoluto de 1 m. Es evidente que el error absoluto en el segundo caso 
es mucho mayor que en el primero, pero ^cual de las dos medidas es rnejor? En 
el primer caso nos equivocamos en 1mm. de cada 5 mm., mientras que en el 
segundo, el error es de 1 m. de cada 100 m. Es decir, es necesario relativizar el 
error en funcion del tamano de las cantidades con las que estamos trabajando. 
Por eso se trabaja con el error relativo que corresponde al cociente entre el error 
absoluto y la cantidad a aproximar. Asi pues, en la medicion del tornillo estamos 
cometiendo un error de | = 0.2, mientras que al medir el campo de futbol hemos 
cometido un error relativo de = 0.01 (bastante menor que el anterior). Es 
habitual usar porcentajes cuando trabajamos con errores relativos, de modo que, 
teniendo en cuenta que estos vienen dados en tantos por uno, multiplicamos por 
100 para obtener el tanto por cien de error (un 20 % para el primer caso y un 
1 % para el segundo). 

□ HU Metodos directos 

El metodo directo mas conocido para la resolution de sistemas es el metodo 
de Gauss que virnos en la section 2.2. Con este metodo, tras un nurnero 
finito de pasos llegamos a la solution exacta del sistema, siempre y cuando 
no cometamos errores de redondeo. Tales errores, tal y como acabamos de 
ver, pueden tener consecuencias importantes, de ahf que se hayan desarrollado 
estrategias encaminadas a minimizar estos efectos no deseados. 

Para ver de que manera afectan los errores de redondeo al metodo de Gauss, 
veamos un ejemplo en el que los calculos los haremos de forma similar a como 
los realiza un computador. Para ello sera necesario explicar de forma muy 
resumida como funciona la aritmetica de coma flotante. Basicamente se trata 
de representar los numeros reales mediante una expresion del tipo 

x = m ■ 10 e 

donde m es la denominada mantisa y e es el exponente. 5 La mantisa es de la 


*En realidad los ordenadores trabajan en base 2, pero por simplicidad en la exposition, 




104 


Tema 3 ■ Sistemas de ecuaciones lineales 


forma m = 0 .dic ?2 • • • rffc con cL\ ^ 0 , mientras que k es el numero de cifras 
significativas. Asf, si por ejemplo, el computador que estamos usando emplea 4 
cifras significativas, el numero 22.385 se representa por 0.2238-10 2 , mientras que 
0.00023 se representa por 0.23-10“ 3 . La operation suma (o resta) de dos numeros 
en coma flotante es realizada por los computadores de una forma peculiar: si 
queremos sumar x = m\ ■ 10 ei con y = m 2 • 10 e2 , con e\ > e 2 , haremos lo 
siguiente 


x + y = mi • 10 ei + m 2 • 10® 2 = (mi + 77 i 2 • 10® 2 61 ) • 10® 1 
Por ejemplo, 

22.385 + 0.00023 = 0.2238 • 10 2 + 0.23 • 10 ~ 3 

= (0.2238 + 0.23 • 10~ 5 ) • 10 2 = 0.2238023 • 10 2 

que con 4 cifras significativas es 0.2238 • 10 2 . 

Veamos como afectan estos calculos a la resolution de un sistema: 


■— ^ - 

Consideremos el siguiente sistema: 


O.OOOln + x 2 = 2 
X\ + x 2 = 3 

cuya solution exacta es x\ = g 0 ^ 0 « 1.0001 y X 2 = g 9 ^ 9 9 7 ~ 1.9999. Supongamos 
que nuestro computador trabaja con aritmetica de coma flotante con 4 cifras 
significativas. Las operaciones del metodo de Gauss son: 


0.1 • KT 3 0 . 1-10 
0 . 1-10 0 . 1-10 




0.1 • 10 
-0.9999 • 10 5 


0.2 • 10 
- 0 . 2 - 10 5 


Resolviendo queda X\ = 0 y X 2 = 2, de modo que la solution numerica para X\ 
tiene un error relativo aproximado del 100 %. 

lA cjue se debe esta enorme diferencia? Observemos que en este ejemplo, la 
unica operation que lleva a cabo el metodo de Gauss es F 2 — 0 0001 ~^' 1 ' C 01110 
podemos apreciar, estamos dividiendo por un numero cercano a cero, lo cual, 
en virtud del comentario hecho antes, distorsiona los resultados. 


nosotros usamos la base 10. 
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^Que ocurre si en lugar de resolver el sistema tal y como lo tenemos, lo 
resolvemos intercambiando previamente las ecuaciones? En este caso 


/ 0 . 1-10 0 . 1-10 
yO.1-10" 3 0.1-10 


0.3-10 

0 . 2-10 


F2-10~ 4 Ji 


0.1 • 10 0.1 • 10 

0 0.0999 ■ 10 


0.3 • 10 
0.1997-10 


Ahora las soluciones son x\ = 1.0009 y X 2 = 1.9990. Vernos ahora que el mayor 
error relativo cometido no llega al 0.1%. 


Si revisamos con atencion las operaciones que realiza el metodo de Gauss 
sobre un sistema observamos que, en cada iteration, con objeto de triangular el 
sistema, es preciso multiplicar por el cociente entre el elemento de la columna que 
queremos anular y el elemento de la diagonal que usarnos como referenda. Este 
elemento es el denominado pivote. En el primer caso del ejemplo 3.6, el pivote 
era 0.0001, que al ser proximo a cero hace que las divisiones por este conlleven 
errores mayores de lo que cabria esperar. Por el contrario, en el segundo caso 
del misrno ejemplo, al intercambiar las ecuaciones entre si, el pivote es ahora 1, 
y no se producen distorsiones al dividir por el. 

Puesto que el intercambio de filas en la matriz de un sistema no altera 
las soluciones del mismo, el conocido como metodo de Gauss con estrategia de 
pivoteo parcial , consiste seneillamente en intercambiar las ecuaciones de orden 
con objeto de que el pivote resulte ser el de mayor valor absoluto de entre todos 
los posibles, que es lo que se ha hecho en el ejemplo 3.6. Veamoslo en un nuevo 
ejemplo. 



Resolvamos el siguiente sistema usando el metodo de Gauss con y sin 
estrategia de pivoteo parcial usando aritmetica de coma flotante con 4 cifras 
significativas y comparemos resultados 


— 2x + 4 y — I6z = —38 

14x + 2y + 4:Z = —10 > 

\d>x + 40 y — 4z = 55 J 

Notese que la solution exacta es x = 2, y = 2.5, z = 3.25. 
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Sin estrategia de pivoteo, 


f “ 2 

4 

-16 

-38 \ 

14 

2 

4 

- 10 

V « 

40 

-4 

55 J 


F 2 -\- r 7F 1 

f -0.2-10 

0.4-10 

-0.16 • 10 2 

-0.38-10 2 \ 

^ 3 + 8 ^ 1 ^ 

0 

0.3- 10 2 

-0.108 • 10 3 

-0.276 • 10 3 


V 0 

0.72 • 10 2 

-0.132 • 10 3 

-0.249 • 10 3 J 


/ -0.2 • 10 

0.4-10 

-0.16 • 10 2 

-0.38 • 10 2 \ 

0 

0.3 • 10 2 

-0.108 • 10 3 

-0.276 • 10 3 

V » 

0 

0.1272 • 10 3 

0.413-10 3 J 


Resolviendo obtenemos: x = 2.033, y = 2.4666 y z = 3.2468. 

Procedamos ahora usando el metodo de Gauss con estrategia de pivoteo 
parcial. En lugar de escoger como pivote el —2, usaremos el de mayor valor 
absoluto de la primera columna, esto es 16, por lo que procedemos en primer 
lugar intercambiando las filas primera y tercera, 


/ -2 4 -16 

14 2 4 

y 16 40 -4 



55 

-10 

-38 


F 2 -0.875Fi 

/ 0.16-10 2 

0.4 • 10 2 

1 

O 

i— 1 

o 

0.55 • 10 2 \ 

F 3 +0.125Fi 

0 

-0.33 • 10 2 

0.75 • 10 

-0.5812 • 10 2 


V 0 

0.9-10 

-0.165 • 10 2 

-0.3112 • 10 2 J 


El siguiente paso sera elegir el pivote para la segunda columna. Debemos rnirar 
cual, de entre los elementos de la segunda columna que quedan por debajo 
de la diagonal (no es posible escoger como pivote el de la primera fila, pues 
perderfamos el cero ya obtenido), tiene mayor valor absoluto. Observamos que 
ahora no es necesario intercambiar filas pues el pivote de mayor valor absoluto 
ya se encuentra en la segunda fila. Asf: 


F 3 +0.2727F 2; 


f 0.16-10 2 

0.4- 10 2 

-0.4- 

10 

0.55 • 10 2 \ 

0 

-0.33 • 10 2 

0.75- 

10 

-0.5812 • 10 2 

V » 

0 

-0.1445 

• 10 2 

-0.4696 • 10 2 J 
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y resolviendo obtenemos x = 1.9981, y = 2.4993 y z = 3.2498. 

Vemos que la aproximacion en el segundo caso es un poco mejor que en el 
primero. ^Puede el lector calcular los errores relativos de las dos aproximaciones? 


En definitiva, con la tecnica del pivoteo parcial se pretende que los errores 
de redondeo cometidos de forma natural por las computadoras queden mini- 
mizados. Existe una version similar al pivoteo parcial, denominada metodo de 
Gauss con estrategia de pivoteo total que, en lugar de elegir como pivote el 
elemento de mayor valor absoluto de la columna, selecciona el de mayor valor 
absoluto considerando todas las filas y columnas a partir del elemento diago¬ 
nal que corresponda. Si bien computacionalmente el pivoteo total proporciona 
mejores resultados, su implementation precisa de un renombrado de variables 
(cuando nos vemos obligados a intercambiar columnas entre si) que lo hacen 
rnenos popular que la tecnica del pivoteo parcial. 

Factorization LU 

Es frecuente en las aplicaciones que tengamos que resolver una cierta canti- 
dad de sistemas del tipo Ax = b en los que la matriz A permanece fija, pero el 
segundo miembro cambia (vease la section 3.5). La factorizacion LU consiste 
en escribir la matriz A como el producto de dos matrices, una triangular inferior 
L y una triangular superior U de manera que A = LU. e 

Si conocemos una factorizacion de la matriz A de este tipo y queremos 
resolver el sistema Ax = b, entonces podemos proceder del siguiente modo: 



Es decir, en primer lugar resolvemos un sistema con matriz L y segundo miembro 
b, denotando por y su solution, y a continuation, resolvemos el sistema con 
matriz U y segundo miembro y, cuya solution sera x, la solution del sistema 
original. 

iQue ventaja supone resolver los sistemas Ly = b y luego Ux = y en lugar 
del sistema original Ax = b? Si observamos las matrices de estos sistemas, L es 
una matriz triangular inferior, de manera que la resolution de un sistema con 
esta matriz se reduce a un sencillo y rapido proceso de subida. Por su parte, U 
es triangular superior de manera que el sistema Ux = y se resuelve facilmente 

6 El nombre proviene de las siglas en ingles L por lower (inferior) y U por upper (superior). 
Aunque el metodo basico ya era conocido por Gauss, fue el norteamericano Myrick Hascall 
Doolittle a finales del s. XIX quien lo formulo de manera algontmica. 
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mediante una bajada . 7 En definitiva, una vez conocida la factorization LU de 
una matriz A, cualquier sistema se va a poder resolver realizando primero un 
proceso de subida y luego uno de bajada, lo cual es enormemente ventajoso 
desde el punto de vista computational. 

El calculo de la factorization LU se lleva a cabo de forma sencilla a traves del 
metodo de Gauss y de las matrices elementales introducidas en la section 2.3. 
Recordemos que las matrices elementales permiten expresar las transformaciones 
que se llevan a cabo en el metodo de Gauss como producto de matrices. 

Veamoslo con un ejemplo. 


Si aplicamos el metodo de Gauss a la matriz 


A = 



olvidandonos del segundo miembro, las operaciones elementales sobre esta ma¬ 
triz se escriben, 



F 2 — 3-Fi 



F3 + iF 2 



= u 


Notese que la matriz final es triangular superior y la denotamos por U. Cada 
una de las operaciones realizadas tiene su correspondiente matriz elemental: 


F 2 - 3F 1 —► £ 12 (-3) = 


F, 


\F 2 


E 23 (h) — 



Es decir, en terminos de matrices elementales, el metodo de Gauss ha realizado 
la multiplication 

E 23 {\)E 12 (-3)A = U 


7 Esto es lo analogo de una subida, solo que en lugar de empezar por la ultima ecuacion, 
comenzamos por la primera. 
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Notese ademas que cada una de las matrices elementales empleadas es trian¬ 
gular inferior. 8 Ademas, el producto de matrices triangulares inferiores es una 
matriz triangular inferior, y la inversa de una triangular inferior, tambien es 
triangular inferior. Asf pues, la matriz E 23 (^)Ei 2 (—3) y su inversa son matrices 
triangulares inferiores. Por tanto, podemos escribir 

A = (E 23 {\)E 12 {- 3))- * 1 U = (£i 2 (—3))- 1 {E 23 {1))~ 1 U 

Denotando por L = {Ei 2 {— 3)) 1 ( E 23 (|)) , que es una matriz triangular 
inferior, obtenemos la factorizacion LU de A. Es decir, hemos escrito A como 
un producto de una matriz triangular inferior y una matriz triangular superior. 

En realidad, para calcular la matriz L no es necesario calcular las inversas 
de las matrices elementales y luego los productos entre las mismas, pues estas 
operaciones se pueden hacer de forma mas simple. Por una parte, las inversas 
de las matrices elementales son inmediatas; mas concretamente se tiene que 

(^■(A ))” 1 = Eij(—X), (Ei( A ))’ 1 = E^) 


Es decir, las inversas de matrices elementales son tambien matrices elementales. 
Por tanto, efectuar el producto de tales matrices equivale a realizar la correspon- 
diente operacion que representan sobre la matriz identidad (atencion al orden 
de la multiplicacion). En el caso que nos ocupa: 






0 

1 

l 

5 



= L 


obteniendose de este modo la matriz L buscada. 


Mas aun, calcular la matriz L no requiere tener en cuenta todo lo anterior, 
sino simplemente prestar atencion a las operaciones llevadas a cabo en el metodo 
de Gauss. Lo vemos en el siguiente ejemplo. 


®Este hecho se cumple para todas las matrices elementales de tipo (il) y (ill), siempre que 

i < k, pero no es cierto para las de tipo (i) (vease la Definicion 2.11). 
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Resolver mediante una factorization LU el sistema siguiente: 

Xi — X2 2^3 — 2 1 

2xi + x 2 + x 3 = 3 > 

3aq — x 2 + x 3 = 3 I 

Llevaremos a cabo en primer lugar la factorization LU de la matriz de 
coeficientes: 



La operaciones a realizar son: 




Para construir la matriz L simplemente “coleccionamos” las operaciones “inver- 
sas” de las realizadas en la matriz identidad, comenzando desde el final: 




f 3 —2F 2 ^ 

F3+2F2 


0 

1 

2 



f 1 ° 

0 3 

yO 2 



F 2 -2Fi 

F 3 —3Fi 

F2+2F1 

F3-I-3F1 




= L 


Observese que hernos escrito encima la operation que marcaba el metodo de 
Gauss, y debajo y en negrita, la operation inversa que hemos realizado. 

Podemos comprobar facilmente que LU = A. Para resolver ahora el sistema 
initial resolvemos primero el sistema Ly = b. Es decir, 
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Es importante resaltar el hecho de que la factorizacion LU de una matriz 
no es unica, puesto que el metodo de Gauss tampoco lo es. Por otra parte, hay 
que mencionar que en determinados sistemas el proceso llevado a cabo no es 
posible. Por ejemplo, si el elemento an = 0, para aplicar el metodo de Gauss 
es preciso intercambiar filas de la matriz, lo cual lleva consigo la introduction 
de una matriz elemental que ya no es triangular, lo que nos conduciria a una 
matriz L no triangular inferior. En realidad esto no supone un problema grave, 
pues el remedio consiste en intercambiar desde el principio el orden de las filas 
de la matriz (es decir, intercambiar el orden de las ecuaciones) para no tener que 
introducir matrices no triangulares en el proceso. En tales casos, las matrices L 
y U obtenidas no son una factorizacion de la matriz original, sino de una matriz 
en la que se han intercambiado algunas de sus filas. Veamoslo en el siguiente 
ejemplo. 


Encontrar la factorizacion LU de la matriz 


/o 2 

A= l 2 4 

V 1 



Observemos como el primer pivote no nos sirve, lo cual nos obliga a cambiar el 
orden de las filas de la matriz. Asf, aplicamos el metodo de Gauss a la matriz 
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Se tiene por tanto que LU = A' o tambien LU = PA donde P es la matriz 
correspondiente al intercambio entre las filas uno y dos, es decir 

0 i o\ 

10 0 
0 0 1 J 

Este tipo de matrices es conocido como matriz de permutacion. 

003 Sistemas mal condicionados 

Hemos visto al comienzo de esta section que cuando tratamos de resolver un 
sistema lineal numericamente es preciso tener en cuenta la aparicion de errores 
de redondeo provocados por la aritnretica de coma flotante con la que trabajan 
las computadoras. Pero no son estos los unicos errores con los que debemos 
contar. Es frecuente que en el planteamiento de un sistema lineal, la recogida 
de datos que conduce al mismo este afectada por errores de precision, es decir, 
que en lugar de estar resolviendo un sistema Ax = b, tenenros un sistema 
ligeranrente distinto tix = b, denominado generalmente sistema perturbado. La 
cuestion en este caso es ver si el hecho de que la diferencia entre el sistema 
original y el perturbado sea pequena conduce a que la diferencia entre sus 
soluciones tambien lo sea. Veamos un ejemplo. 



Consideremos el sistema 



2x + 3 y 
(2 + 10~ 7 )a; + 3y 


5 

5 


cuya solution es x = 0, y = Modificamos ligeramente el sistema anterior para 
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tener: 

2x + 3 y = 5 1 

(2 + 10- 7 )cc + 3 y = 5 + 10 -7 J 

La solucion exacta es ahora x = 1, y = 1. Observese que la modification 
realizada al sistema es minima (estamos perturbando solo el segundo miembro 
muy ligeramente), sin embargo la solucion del sistema original es muy distinta 
a la del sistema perturbado. 


El anterior es un ti'pico ejemplo de lo que se conoce como un sistema mal 
condicionado , 9 en oposicion a lo que se denomina un sistema bien condicionado, 
en el que pequenas perturbaciones en los datos del sistema conducen a pequefias 
variaciones en su solucion. En lo que sigue veremos que el condicionamiento de 
un sistema depende esencialmente de un parametro denominado numero de 
condition. 

Para hablar del numero de condition es preciso hablar antes de normas , 
concepto que introduciremos detenidamente en el tema 8 . Por el momento nos 
bastara tener una idea intuitiva de lo que es una norma vectorial. Esencialmente 
una norma es una “medida” del tamafio de un vector ; 10 mas concretamente, se 
define la norma de un vector x, que se notara como ||x||, como un numero real 
que verifica las siguientes propiedades: 

(i) ||x|| > 0 , y ||x|| = 0 si y solo si x = 0 . 

(ii) ||Ax|| = |A| ||x||, VA e K. 

(m) ||x + y|| < ||x|| + ||y||. 

Para vectores en K™, el ejemplo mas conocido es la norma euclidea o norma 
2 , definida por 

||x || 2 = \/\xi\ 2 H-h \Xn\ 2 , Si X = (Xi, . . . ,X n ) 

Otras normas habituales son la norma 1: 

11 x11 1 = |xi| H-f \x n \ 

y la norma infinito o norma del supremo: 

l|x||oo = max{|xi|,..., \x n \} 


9 El concepto de condicionamiento fue introducido por el matematico ingles Alan Turing 
en 1948 en un trabajo titulado Rounding-off errors in matrix processes , convirtiendose en el 
fundador del Algebra Lineal Numerica moderna. 

10 Hablaremos de vectores a partir del tema siguiente aunque seguramente el lector ya este 
familiarizado con ellos. 
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Sean ||-||,|,y||-||j|t, dos normas vectoriales en K m y K™, respectivamente. Se 
denomina norma matricial en _Ad mX n(P inducida por dichas normas vectoriales 
a 


Pll = sup 

x/0 


Px|k 

l|x||* 


En general, es habitual que las normas vectoriales consideradas sean la misma 
(aunque en diferentes espacios) por lo que evitaremos los subindices en las 
normas para no recargar la notation. 

Es facil, a partir de la definition, probar que una norma matricial satisface 
las propiedades (i)-(m) que definen una norma. Por otra parte, es inmediato 
comprobar que 

Pxll < Pll ||x||, Vxer (3.3) 

Tambien se puede probar que si || ■ || es una norma en A / l n (K) inducida por 
normas vectoriales, entonces 

\\AB\\ < P|| pH, VA,BeM n (K) 



Sea A £ A1„(K) regular y || • || una norma matricial inducida por una norma 
vectorial. Se define el numero de condicion de A como 


k(A) = \\A\\ pp| 
Si A es singular, se define k(A) = oo 


La definition se puede extender para el caso de matrices no cuadradas, pero 
no la usaremos aqui. El numero de condicion de una rnatriz nos da una medida 
del condicionamiento del sistema: cuanto mayor es, peor es el condicionamiento. 
Mas concretamente, supongamos que tenemos un sistema cuadrado con rnatriz 
regular Ax = b y el correspondiente sistema perturbado Ax = b + Ab, en el 
que consideramos una variation del segundo miembro “pequena”. La idea es 
analizar la diferencia entre la solution del sistema original x y la del sistema 
perturbado x. 

Restando ambos sistemas: 


Ax = b 
Ax = b + Ab 


A(x — x) = Ab 
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y puesto que A es invertible, multiplicando por A 1 y usando (3.3) 
x - x = A- 1 Ah =► ||x - x|| < ||A _1 || || Ab|| 


Por otra parte (usando nuevamente (3.3)), ||Ax|| = ||b|| => ||x|| > ——. Luego, 

11^1 


|x , x|1 < l|Al || < p- 1 !! 


(3.4) 


La cantidad ||x — x|| es el error absoluto entre la solution del sistema original 
y la solution del sistema perturbado, mientras que el cociente ^ es el error 


relativo. Por su parte, es el error relativo de la perturbation que hacemos 

del sistema. En consecuencia, lo que (3.4) pone de manifiesto es que el error 
relativo al resolver un sistema esta acotado por el numero de condition de 
la matriz multiplicado por el error relativo de la perturbation. Si se supone 
que la perturbation es pequena y el numero de condition tambien, el error 
cometido sera pequeno. Si por el contrario, el numero de condition es grande no 
podemos esperar a priori que el error cometido sea pequeno (aunque en algun 
caso concreto si que lo pueda ser). 


En el ejemplo 3.11, lo que esta ocurriendo es que el numero de condition 
de la matriz del misrno es grande. Nos remitimos a la section 3.4 en la que 
calculamos el numero de condition para esta matriz. 


BBS Metodos iterativos 

Hemos hablado ya de los metodos directos para resolver sistemas, que son 
aquellos con los que se pretende llegar a su solution tras un numero finito 
de pasos. En esta section presentaremos un par de metodos iterativos que 
construyen una sucesion de valores que deben tender hacia la solution del 
sistema. Cuando esto ocurre diremos que el metodo converge y en caso contrario 
que diverge. El funcionamiento de los metodos iterativos es siempre el mismo, 
solo cambia el modo en el que se construye cada iteration. Asi, se parte de una 
aproximacion initial x^, donde el superindice hara referenda al elemento de la 
sucesion, a partir de la cual debemos poder construir un nuevo elemento x^ 
que se aproxime aun mas a la solution del sistema, reiterandose el procedimiento 
un determinado numero de veces. Si el metodo converge, al cabo de un cierto 
numero de pasos el termino de la sucesion obtenido deberia ser una buena 
aproximacion a la solution buscada. Este tipo de metodos es bastante eficaz 
para matrices grandes vacias , esto es, con una gran cantidad de ceros. 
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Metodo de Jacobi 11 

Supongamos que tenemos el sistema de n ecuaciones con n incognitas si- 
guiente 

auXi + CI 12 X 2 H-h a ln x n = h 

CI21X1 + CI22X2 -h ■ ■ ■ + a2nX n = i>2 


^n\X\ d - a n 2X2 H-+ &nnXn — bn 

en el que todos los elementos diagonales an 7 ^ 0. Dada una aproximacion ~xS k \ 
se construye x (fc+1 ) del siguiente modo: 


,(*+1) _ 

1 

l 

(bi- 

(k) 

012^2 — 

- a ln x {k) 


an 




.(*+1) 

2 — 

1 

(h- 

( k ) 

021*1 

■ ■ ■ a 2 n x {k) 


^22 




,(fc+i) 

1 


_ (fc) 

_ _(fc) 

n 


ybn 

Q'nl'J'i 

2^2 


(3.5) 


Es decir, basicamente obtenemos la componente i-esima de la nueva aproxima¬ 
cion resolviendo la ecuacion i-esima en esa misma variable. Dicho de otro modo, 
en cada iteration resolvemos n ecuaciones, cada una de cllas con una linica 
incognita. 


Aplicar el metodo de Jacobi al sistema 


lOaq — X 2 + 2^3 = 6 

—X\ + 11x2 — X3 + 3.T4 = 25 

2aq — X 2 + lOa^ — X 4 = —11 

3x2 — X 3 4 - 804 = 15 


(3.6) 


Consideramos = (0, 0,0,0). La iteraciones del metodo son: 
4 fe+1) = 77 , ( 6 + x 2 k) - 2 x 3 k) ) 


Ak+i) 


10 

1 (nr 1 (fc) | ( k ) 

=YY ( 25 + ®i + x \ 


-3x[ k) ) 


Introducido por el matematico aleman Carl Gustav Jakob Jacobi en 1845. 
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4* +I) =^(- 11 -2»'S l, +4* > +4' 1 ) 

4* +1) =i(l5-3x<‘> + x<“) 

Asi, para calcular x^ 1 - 1 sustituimos los valores de las componentes de x^ 0 -* en el 
esquema anterior, obteniendo x^ 1 ) = (0.6,2.2727,-1.1,1.875). A continuation, 
repetimos el proceso sustituyendo los valores obtenidos de x^ 1 ) para calcular 
x^ 2 ), etc. 

x< 2 ) = (1.0472,1.7159,-0.8052,0.8852), 

X ( 3 ) = (0.9326,2.0533, -1.0493,1.1308), 

A1 cabo de diez iteraciones se tiene que x^ 10 ) = (1.0001,1.9997, —0.9998,0.9997). 
Notese que la solution del sistema es (1,2,—1,1), lo que nos confirma que el 
metodo esta convergiendo. 


Metodo de Gauss-Seidel 12 

Si miramos el metodo de Jacobi con atencion podemos observar que la 
construction de cada componente de x^ fc+1 ^ usa solo la information obtenida 
de x( fc ); sin embargo, a la hora de calcular ya conocemos los valores de 

Xj para j < i. El metodo de Gauss-Seidel simplemente aprovecha este hecho. 
Asi, al igual que antes, comenzarfamos con una aproximacion initial dada x^°l, 
y en cada iteration, conocida la aproximacion x^ calculamos x^+b mediante: 

a;^ fc+1) = — (bi - a 12 x { 2 k) - a ln x (k A 

an v ' 

^(fe+i) _ J_ _ a2ia .( fe + 1 )- a 2 n x ( 'n ) ) 


(k+1 ) _ 1 


= - (bi~ 

(i.aa \ 


Jk + 1) 


(*+!) Jk) 


l*^i— i 


’ ’ ’ 


(k)' 


Introducido por el aleman Philipp Ludwig von Seidel en 1874. 
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4 fe+1) = — (bn - a n ix[ k+1) - a n2 x ( 2 k+1) - ■ 


ffc+i) 

' ' &n,n— l% n — 1 


Es de esperar que el metodo de Gauss-Seidel converja mas rapidamente que 
el metodo de Jacobi, aunque no siempre es asf. Lo que si se puede probar es que 
converge, al menos, igual de rapido que el de Jacobi. 


Aplicamos el metodo de Gauss-Seidel al sistema (3.6). Iniciando desde el 
misrno valor xG) = (0,0, 0, 0), la iteration a realizar es 


r (fc+i) 

x i 

T ( fe +!) 

J '2 

T ( fe +!) 

x 3 

T (*+l) 

*^4 


1( 6 + x <«-24->) 

) r (25 + iS‘ +1 >+xf-3if) 

^ (-li - ix'!" 1 '' +4‘ +1) +4*’) 


Al igual que antes, para obtener x^ sustituimos los valores de las componentes 
de xG) de las que partimos; pero para calcular x ^, ya conocemos la componente 
x^\ de manera que la usamos en lugar de x\ 0> . Asf, procedemos con las demas 
componentes en cada iteration, obteniendose 

x^) = (0.6,2.3272,-0.9872,0.8788), 

X G) = (1.0301,2.0369,-1.0144,0.9843), 
xG) = (1.0065,2.0035,-1.0025,0.9983), 

X G) = (1.0008,2.0002,-1.0003,0.9998) 

Vemos que en este caso, con la mitad de iteraciones obtenemos una precision 
similar a la obtenida con el metodo de Jacobi. 


Por otra parte, es importante resaltar que la convergencia de arnbos meto- 
dos no esta asegurada. Se pueden dar condiciones suficientes para que ambos 
metodos converjan. Una de las mas habituales es la diagonal dominancia. 
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Se dice que una matriz A € ,M n (K) es diagonal dominante (por filas) si 




Vi 


Es decir, en cada fila, el elemento diagonal en modulo (o valor absoluto) es 
mayor que la suma de los modulos del resto de elenrentos de esa fila. El mismo 
concepto se puede aplicar por columnas. Se puede probar que si una matriz es 
diagonal dominante, los metodos de Jacobi y Gauss-Seidel convergen. 

HI - 

CALCULO CON PYTHON 

Como hemos comentado con anterioridad, la necesidad de resolver sistemas 
de ecuaciones lineales de gran tamano dio lugar al Algebra Lineal Numerica 
de la que hemos descrito unas pinceladas en la seccion anterior. Python, conro 
lenguaje de programacion que es, es un entorno adecuado para programar los 
diversos algoritmos que hemos visto, sin embargo, no queremos dedicar nuestra 
atencion en este texto al aprendizaje de la programacion (aunque se veran 
algunos ejemplos) sino al uso de algunas de las herramientas que Python tiene 
incorporadas para resolver sistemas de ecuaciones. 

La solucion de sistemas de ecuaciones desde NurnPy es sencilla; basta invocar 
la funcion linalg.solve con la matriz del sistema y el segundo miembro: por 
ejemplo, el codigo 

1 >>> from numpy import matrix,linalg 

2 >>> a=matrix(’2. 11; 121 ; 112 ’) 

3 >>> b=matrix(’l; 2; 3’) 

4 >>> linalg.solve(a,b) 

5 matrix ([[-0.5] , 

e [0.5], 

7 [ 1.5]]) 


resuelve el sistema 






cuya solucion es X\ = —0.5, aq = 0.5 y X3 = 1.5. 

Si la matriz es no cuadrada o singular, obtendremos un error. 
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Por su parte, SymPy nos ofrece mas sofisticacion, permitiendo resolver 
sistemas indeterminados, aunque su utilidad es escasa si el sistema es grande. 
Por ejemplo, 

1 >>> from sympy import Matrix,solve_linear_system 

2 >>> from sympy.abc import x,y,z 

a >>> A = Matrix([[-2,1,1,0] , [1,-2,1,0] , [1,1, -2,0]]) 

4 >>> solve_linear_system(A,x,y,z) 

5 {x: z, y: z} 

corresponde a la solucion de 


—2 x + y + z = 0 

x — 2 y + z = 0 

x + y — 2z = 0 


que es un sistema compatible indeterminado con solucion: (a, a, a). 

Vemos que es necesario pasar como argumento la rnatriz ampliada del sistema 
y los nombres de las variables que reciben la solucion. 

Otra option para resolver un sistema pasa por el uso del modulo rrefO 
de SymPy que ya vimos en el tema anterior. Este modulo permite hacer una 
reduction tipo Gauss de una rnatriz, y por tanto nos esta proporcionando de 
forma indirecta la solucion de un sistema. 


>>> 

f r 

om sympy import 

Matrix 

>>> 

a= 

Matrix([[2,1,1, 

1] 

[1,2,1,2] , [1,1,2,3]] ) 

>>> 

a . 

rref () 



([1 

0 

, 0, -1/2] 



[0, 

1, 

0, 1/2] 



[0, 

0, 

1 , 3/2] , [0 , 

1 , 

2]) 


corresponde a 


/ 2 1 1 1 
I 1 2 1 2 

\ 1 1 2 3 


-» 


1 0 0 I 
0 10 § 
0 0 1 I I 


Si miramos la ultima columna de la rnatriz resultante, esta es precisamente 
la solucion del sistema. Como ya comentamos, rrefO realiza una reduction 
tipo Gauss, hasta obtener una rnatriz diagonal, con unos en la diagonal (en este 
caso, la rnatriz identidad). Luego el segundo miembro del sistema (la ultima 
columna) resulta la solucion (vease el ejemplo 2.10). 

La factorization LU de un rnatriz tambien es posible, aunque no esta definida 
en NumPy, sino en un modulo habitual para el calculo cientifico conocido como 
SciPy. 13 

1,i www. scipy. org 
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1 

>>> from 

numpy 

import 

matrix 


2 

>>> from 

scipy 

import 

linalg 


3 

>>> a=matrix(’ 

2. 11; 

1 2 1 ; 1 1 2 ’) 


4 

>>> p , 1 , u 

=linalg.lu(a) 



5 

>>> p 





6 

array ( [ [ 

1. , 

0. , 0.] 

i 


7 

[ 

0 • , 

1 . , 0.] 

J 


8 

[ 

0 • , 

0., 1.]]) 


9 

>>> 1 





10 

array ( [ [ 

1 . 

, o. 

, o. 

] , 

11 

[ 

0.5 

. 1. 

, 0. 

] , 

12 

[ 

0.5 

. o. 

33333333, 1. 

]]) 

13 

>>> u 





14 

array ( [ [ 

2 . 

, 1 • 

, 1 • 

] , 

15 

[ 

0 . 

, 1 • 

5 ,0.5 

] , 

16 

[ 

0 . 

, 0. 

, 1.33333333]]) 


1 A /1 o o\ / 2 i A 

2 1 = 5 1 0 o I I 

1 V \i I V \° 0 l) 

Observese el tipo de llamada (lmea 4): la funcion lu proporciona tres 
resultados (las matrices P, L y U, por ese orden), que son almacenadas en 
las variables p, 1 y u, que, conro ya hemos visto, corresponden a la matriz de 
permutacion P y las matrices L y U que verifican PA = LU. Notese que en este 
caso P es la matriz identidad. 

Si por el contrario escogemos el modulo SymPy: 

1 
2 

3 

4 

5 

6 

7 

8 
9 

10 
11 
12 
13 


>>> from sympy import Matrix 

>>> A=Matrix([[0,3,2],[1,0,-3],[-2,1,-1]]) 

>>> 1,u,p=A.LUdecomposition() 

>>> 1 

[ 1, 0, 0] 

[ 0 , 1 , 0 ] 

[-2, 1/3, 1] 

>>> u 

[1, 0, -3] 

[0, 3, 2] 

[0, 0, -23/3] 

>>> p 
[[ 1 , 0 ]] 


es decir, 



vemos que la llamada difiere con respecto a la descomposicion LU de SciPy. 
En este caso se obtienen L, U y P, en ese orden, teniendo en cuenta que P no 
viene dada en forma de matriz, sino a traves de los indices de las filas que han 
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permutado (en este caso la primera con la segunda). En definitiva: 

/o 1 o\ / 0 3 2\ / 1 0 o\ /l 0 -3\ 

[ 1 0 0 ] [ 10-3 =1 0 10103 2 

\° 0 V \- 2 1 V \- 2 3 V \° 0 -fj 

Por otra parte, NumPy tambien permite el calculo del numero de condition 
de una matriz: 


1 >>> from numpy import matrix,linalg 

2 >>> a=matrix(’2 3; 2+le-7 3’) 

a >>> a 

4 matrix ( [ [ 2. , 3. ] , 

5 [ 2.0000001 , 3. ] ] ) 

6 >>> 1inalg.cond(a) 

7 86666667.760877177 


esto es, 


K 


.2 + 10 


-7 


86666667.76 


indicandonos el mal condicionamiento de la matriz del ejemplo 3.11. 


Finalmente, veamos un pequeno programa para realizar las iteraciones del 
metodo de Jacobi mostrado en la section anterior. Con objeto de implemen- 
tar el codigo de forma eficiente en Python, hay que evitar en la medida de lo 
posible la aparicion de bucles, pues estos ralentizan enormemente la ejecucion 
de los programas. Para evitar bucles la mejor option es “vectorizar” las opera- 
ciones que involucran un arreglo o matriz, pues estas se computan mucho mas 
rapidamente. 

Asi pues, vamos a reinterpretar las operaciones del metodo de Jacobi del 
siguiente modo. Si observamos el segundo miembro de (3.5) vemos que corres- 
poncle al producto de los inversos de los elementos diagonales de la matriz A, 
por un parentesis que corresponde a la diferencia entre b y el producto de la 
matriz A, sin los elementos diagonales, por x. 

Veamoslo del siguiente modo: sea D la matriz diagonal, cuya diagonal es la 
misma que la de la matriz A, y sea A = A — D. El sistema Ax = b se puede 
escribir como 


(I + D)x = b => Dx = b — Ax ==> x = D~ x b - D ~ l Ax 


Observando el ultimo termino, vemos que corresponde exactamente con el 
segundo miembro de (3.5). Por tanto, las iteraciones del metodo de Jacobi ahora 


son: 


x (fc+!) =r 1 b-£r 1 lx w 


(3.7) 




3.4 ■ Calculo con Python 


123 


Definimos entonces una funcion en Python que, introducidas la matriz del 
sistema, el segundo miembro, una aproximacion inicial y el numero de iteraciones 
a realizar, devuelve el valor de la ultima iteration calculada: 


1 

from numpy import diagflat,zeros,linalg 

2 

from sys import exit 

3 

def jacobi(a,b,xO=None,iter=10): 

5 

if a.shape [0] !=a.shape [1] : 

6 

exit(’la matriz no es cuadrada’) 

7 

elif (b.shape [1]!=1) or (b.shape[0]!=a.shape[0]): 

8 

exit (’el segundo miembro no es correcto ’) 

9 

if xO is None : 

10 

x0 = zeros((a.shape [0] , 1)) 

11 

elif(b.shape!=x0.shape): 

12 

exit(’dato inicial incorrecto ’) 

13 


14 

d=diagflat(a.diagonal()) 

15 

if (linalg.det(d)= = 0) : 

16 

exit(’hay elementos diagonales nulos ’ ) 

17 

atd=d.I*(a-d) 

18 

c=d.I*b 

19 

for i in range(iter): 

20 

x = c-atd* xO 

21 

x0 = x 

22 


23 

return xO 


Las dos primeras lfneas realizan la importation de las funciones necesarias 
para el programa. Destacamos en este codigo la aparicion de la instruccion 
exit() del modulo sys, que permite abandonar la ejecucion del mismo. Diclia 
instruccion es usada entre las lfneas 5-8 en caso de que se cumpla alguna de las 
condiciones if expuestas. Estas condiciones comprueban que los argumentos de 
entrada son correctos: en concreto, se analiza si el dato a es una matriz cuadrada 
y si el dato b es una matriz columna con la misrna dimension que a. Si no se 
cumple alguna de estas condiciones la ejecucion del programa se detiene con la 
impresion del mensaje correspondiente. 

Otra novedad del codigo es la aparicion de argumentos por defecto en la 
llamada a la funcion (lfnea 3). Puesto que es habitual que la aproximacion 
inicial sea una matriz de ceros, podemos omitir la aproximacion inicial en la 
llamada a la funcion, y en ese caso, el programa crea una aproximacion inicial 
nula (lfneas 9-10). En caso de que sf se haya introducido una aproximacion 
inicial se comprueba que esta tiene las dimensiones adecuadas. 

La lfnea 14 crea la matriz d correspondiente a la diagonal de la matriz del 
sistema. Para ello se ha usado el atributo diagonal () con el que se obtiene 
una matriz fila correspondiente a la diagonal de la matriz a, y con la funcion 
diagf lat se construye una matriz diagonal, cuyos elementos diagonales son los 
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de la matriz fila usada como argumento. 

A continuation, en las lmeas 17 y 18 se construyen los elementos para la 
iteracion, segun hemos visto en (3.7). Notese tambien que comprobamos que la 
matriz d es invertible calculando su determinante. 

Llegados a este punto es interesante notar que, hasta el momento, no se 
han realizado mas que pequenas comprobaciones y calculos preparativos. Las 
iteraciones del metodo de Jacobi se llevan a cabo en las lmeas 19-21. Observar 
tambien que en cada iteracion, actualizamos el valor de la aproximacion, para 
poder calcular la siguiente. 

Para poder usar esta funcion precisamos los datos del sistema y cargarla 
previamente. Suponiendo que el codigo anterior es guardado en un archivo de 
nombre jaco.py, el siguiente codigo muestra como resolver el ejemplo 3.13 

1 >>> from numpy import matrix 

2 >>> from jaco import jacobi 

a >>> a=matrix(’10 -1 2 0; -1 11 -1 3; 2 -1 10 -1; 03-1 8 ’) 

4 >>> b=matrix(’ 6 ; 25; -11; 15’) 

5 >>> j acobi(a,b) 

6 matrix([[ 1.0001186 ], 

7 [ 1.99976795] , 

a [-0.99982814] , 

a [ 0.99978598]]) 

En el ejercicio 23 proponemos al lector la elaboration de un codigo similar 
para el metodo de Gauss-Seidel. 

mm - 

APLICACION: RESOLUCION DE ECUACIONES DIFERENCIALES 

Como hemos comentado anteriormente, los sistemas de ecuaciones lineales 
aparecen frecuentemente en rnuchas aplicaciones de las Matematicas y muy 
especialmente en la resolucion de ecuaciones diferenciales. Aunque este es un 
tema que se escapa de los conocimientos tipicos de los lectores a los que 
va dirigido este texto, creemos importante mostrar como surgen sistemas de 
ecuaciones lineales con un gran nurnero de ecuaciones e incognitas a traves de 
un ejemplo sencillo. 

No es nuestra intention entrar en profundidad en demasiados aspectos acerca 
de las ecuaciones diferenciales; basta decir que se trata de ecuaciones en las que 
la incognita es una funcion (y no simplemente un conjunto de valores), y que 
diclia funcion se haya afectada bajo alguna operation que involucra la derivation. 
Un ejemplo tipico de ecuacion diferencial puede ser: 

u”(x) =0, x £ (0,1) 

Es decir, se trataria de buscar una funcion u definida en el intervalo (0,1) de 
forma que su segunda derivada sea cero, en cualquiera de sus puntos. Con unos 
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conocimientos basicos de derivation podemos ver que cualquier funcion de la 
forma u(x) = ax + b, para cualesquiera valores a y b, es una solution de dicha 
ecuacion. Con objeto de poder encontrar una unica solution de la ecuacion, es 
habitual completarla con alguna condition adicional, como puede ser el valor de 
la funcion en los extremos del intervalo: 

u(0) = 1, u{ 1) = 3 

Con estas condiciones podemos determinar los valores de a y b resultando que 
a = 2 y b = 1. Asi pues, la funcion que cumple la ecuacion diferencial junto con 
las condiciones en los extremos es la recta u(x) = 2x + 1. 

Esta ecuacion diferencial junto con las condiciones adicionales, denominadas 
condiciones de contorno, modelan, por ejemplo, la distribution de temperatura 
de una varilla unidimensional de longitud 1 que no esta sometida a ninguna 
fuente de calor, y en cuyos extremos existe una temperatura dada por los 
valores de las condiciones de contorno. Si anadimos una fuente de calor sobre la 
varilla, medida a traves de una funcion f(x), que se supone conocida, el rnodelo 
matematico que nos proporciona como se distribuye el calor en la varilla viene 
dado por: 

-u"(x) = f(x), 16(0,1) 

it( 0) = a, u(l) = P 

donde a y /3 son las condiciones de contorno, que se suponen dadas. 

Para ciertas funciones / es posible calcular analiticamente la solution de esta 
ecuacion diferencial (integrando dos veces /), pero en general puede ser dificil, 
o incluso imposible, encontrar una expresion explicita para u. En estos casos 
es necesario acudir al Analisis Numerico. En primer lugar hernos de rebajar 
nuestra pretension de encontrar la solution como una funcion, con sus infinitos 
valores en el intervalo (0,1), y buscar en su lugar un numero finito de valores 
de la misma; esto es lo que se conoce como discretizacion. 

La discretizacion pasa por considerar un conjunto finito de puntos en el 
intervalo de partida (0,1). Lo mas habitual consiste en tomar una serie de puntos 
uniformemente espaciados, que denominamos nodos. Para ello tomamos n6N 
y h = , el denominado paso de discretizacion , y creamos los n + 2 puntos 

siguientes del intervalo (0,1): 

Xi = ih, 0 < * < n + 1 

Observemos que Xq = 0 < X\ < X 2 < • • • < x n < x n+ \ = 1. La intention es 
encontrar los valores de la solution de (3.8) en estos nodos. Por ejemplo, ya 
sabemos que u(x o) = a y u(x n + 1 ) = ft, y por tanto nos quedan por encontrar 
u(xi), 1 < i < n, es decir, n valores que seran nuestras incognitas. Por otra parte, 
parece evidente pensar que cuantos mas puntos consideremos en la discretizacion 
mejor sera la aproximacion de la solution que obtengamos. 

El siguiente paso consiste en escribir la ecuacion —u"(x) = f(x ) en funcion 
de esos valores. La cuestion es como evaluar u". Es conocido que el valor de 
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la derivada en un punto x se puede aproximar por cocientes incrementales del 
tipo: 

. u[x + t) — u{x) u(x — t) — u(x) u(x + t) — u(x — t) 

U ^ X ’ t t 2t 

y de forma similar se puede obtener una aproximacion de la derivada segunda: 

u(x + t) — 2u(x) + u(x — t) 


Estas expresiones son mas precisas cuanto mas pequeiio es t. Si ponemos t = h 
en la ultima expresion y evaluamos en un nodo Xi, 

u(x i+ i) - 2 u(Xi) + u(a Jj_i) 
h 2 

debido a la definition que hemos tornado de los nodos. Con objeto de simplificar 
la notation pondremos u(xi) = Ui , y de forma similar f(xi ) = f l . 

Lo que hacemos a continuation es sencillo: sustituimos la ecuacion en x por 
la evaluation de la misma en cada uno de los nodos obteniendo el siguiente 
problema discreto: 


U (Xi) « 


2 Ui ~b Ui—1 

h? 


= fi 


1 < i < n 


(3.9) 


Dado que uq = a , u n + 1 = (3yfi, l<i<n son valores conocidos, estamos 
ante un sistema lineal de n ecuaciones con n incognitas. Vernos por tanto como 
una discretization de una ecuacion diferencial desemboca de forma bastante 
natural en la resolution de un sistema lineal, que sera tanto mas grande, cuanto 
mayor sea el valor de n, lo que a su vez conducira, en principio, a una mejor 
aproximacion de los valores de la solution. 

En este punto es preciso hacer alguna puntualizacion: una discretization de 
una ecuacion diferencial cualquiera no siempre conduce a un sistema lineal, y 
no siempre la solution de un problema discreto proporciona una buena apro¬ 
ximacion del problema original; el Analisis Numerico requiere prestar atencion 
a determinados aspectos que quedan fuera de nuestro interes en este texto. En 
lo que respecta a este ejemplo, si es posible probar que, para un buen numero 
de funciones /, la discretization realizada es coherente con nuestra intuition 
initial; cuanto mayor es n, mejor es la aproximacion obtenida a la solution de 
la ecuacion diferencial. 

Prestemos ahora un poco mas de atencion al sistema (3.9): si escribimos una 
a una sus ecuaciones resulta, 


—uq + 2«i — U 2 = h 2 fi 

-Mi + 2 u 2 - u 3 = h 2 f 2 


'U J n—2 “b 2w n _! U n — h f n —l 

-U n -! + 2u n - U n+ i = h 2 f n 
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que escribimos en forma matricial como 


1 2 

-1 

0 

0 • • 

• 0 

0 N 


( U1 ) 


^ fl + 

-1 

2 

-1 

0 • • 

• 0 

0 




h 









= h 2 


0 

0 

0 

0 • • 

• 2 

-1 


Un— 1 


/n-1 

v° 

0 

0 

0 • • 

• -1 

2 J 


\ U n J 


\fn + PJ 


La matriz del sistema tiene propiedades interesantes. Es lo que se conoce como 
una matriz vaci'a, esto es, con muchos ceros, que ademas tiene una estructura 
especial. Ademas de ser simetrica, es una matriz banda , y mas concretamente 
tridiagonal. Este tipo de matrices son frecuentes en la aproximacion numerica 
de ecuaciones diferenciales y ecuaciones en derivadas parciales, y dadas sus 
especiales caracterfsticas, reciben un tratamiento numerico especial en el que 
no entraremos. 

Para terminar, veamos como resolver un ejemplo con Python. 

Resolvamos numericamente la ecuacion diferencial 


—u"{x) = 47t 2 sen(27rcc), x £ (0,1) 
u(0) = u(l) = 0 


Vamos a crear una funcion (al estilo de la funcion mandelplot del tema 1) 
de tal forma que, dado n el numero de nodos, la funcion / y los valores de 
contorno ay /?, proporcione la solution de (3.8). 


1 

2 

3 

4 

5 

6 

7 

8 
9 

10 

11 

12 

13 

14 

15 

16 

17 

18 
19 


#! /usr/bin/python 

from numpy import pi,linspace ,sin ,diag,ones,linalg,append 
from matplotlib . pyplot import plot , show , grid , axis 

def calor(n, f, alfa, beta): 

x=linspace (0. ,1. ,n + 2) 
h=1./(n+1) 
fx = h**2*f(x [1:n + 1]) 
fx[0]+= alfa 
fx[n-1]+=beta 

a=diag(2.* ones(n)) + diag(-1.*ones(n-1) ,1) + diag(-l.* 
ones(n-1) , -1) 

u=linalg.solve(a,fx) 
u=append(alfa, u) 
u=append(u,beta) 

return u,x 
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20 

21 

22 

23 

24 

25 

26 

27 

28 

29 

30 

31 

32 

33 

34 

35 


f= lambda x: 4*pi**2*sin (2*pi*x) 
n = 40 
alfa=0. 
beta=0. 

u,x=calor(n,f,alfa,beta) 

g=lambda x: sin(2*pi*x) 

plot(x,Ti, ’ k - ’ ,marker=’*’) 
plot (x,g(x) , ’r--’) 
grid(True ) 

axis([0,1,-1.2,1.2]) 
show ( ) 


Analicemos con detenimiento el codigo. Tras la habitual importation de 
funciones de los modulos apropiados (notese por ejemplo la importation de la 
constante pi o la funcion seno desde NumPy), definimos la funcion calor, entre 
las lineas 6-19, que es la que se encarga de resolver la ecuacion diferencial. 

En primer lugar creamos los nodos en el intervalo (0,1) a traves de linspace. 
Esta funcion crea un arreglo formado por n +2 valores entre 0 y 1. A continuation 
calculamos el paso de discretization y en la linea 10 construimos el segundo 
miembro de (3.9). Notese que evaluamos la funcion dato del problema en los 
nodos de un solo golpe, sin necesidad de usar un bucle, excluyendo los valores de 
los extremos pues no son necesarios. En las lineas 11 y 12 rectificamos el primer 
y el ultimo valor de este arreglo segun indica el segundo miembro de (3.10), y 
en la linea 13 construimos la matriz del sistema usando una combination de la 
funcion diag. 

Veamos esta construction con mas atencion: diag(2.*ones(n)) crea una 
matriz diagonal cuya diagonal principal esta formada por 2. *ones (n), que 
corresponde a un arreglo de dimension n formado por unos (esto es lo que hace 
ones(n)), y que esta multiplicado por 2. Es decir, es una matriz diagonal con 

2 en la diagonal. A esta matriz se le suma diag(-l. *ones (n-1) ,1); esta claro 
que es -1. *ones (n-1), mientras que el segundo argumento de diag desplaza 
una diagonal hacia arriba el lugar donde se situan, en este caso, los —1. Algo 
similar hace diag(-l. *ones (n-1), -1), pero en lugar de desplazar hacia arriba, 
lo hace hacia abajo. Ahora es inmediato ver que la suma de estos tres terminos 
es la matriz de (3.10). 

Finalmente, la linea 15 resuelve el sistema, mientras que las lineas 16 y 17 
incorporan los valores en los extremos a la solution obtenida. En la linea 19 se 
produce la salida de la funcion, en la que devolvemos tanto la solution u como 
los nodos x, con objeto de poder dibujarlos si es necesario. 

La ejecucion de la funcion se lleva a cabo entre las lineas 22 y 27. En la linea 
22 definimos la funcion dato del problema, en este caso, fix) = 47r * 2 sen(27ra;). 
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(a) n = 10 (b) n = 40 

Figura 3.1: Solution de la ecuacion del calor 


Si bien se podrfa haber creado dicha funcion mediante 


1 def f(x) : 

2 return 4*pi**2*sin (2*pi*x) 


la funcion lambda simplifica esta definition. Entre las lineas 23 y 25 fijamos el 
resto de parametros de nuestro problema, y en la lfnea 27 llamamos a la funcion 
calor para resolver el problema. 

Con objeto de comprobar la precision del rnetodo empleado para resolver 
la ecuacion diferencial, hernos comparado la solution obtenida con la solution 
exacta, que en este caso conocemos y es g(x) = sen(27ra;). Para ello hemos 
dibujado ambas soluciones con la funcion plot del modulo matplotlib. En la 
figura 3.1 se puede ver el resultado para un par de valores de n distintos. 


HI - 

EJERCICIOS 
Ejercicios de repaso 

|3I Resolver los siguientes sistemas mediante el rnetodo de elimination de 
Gauss: 


X\ + x 2 + x 3 
(a) xi d- 2x 2 F 2^3 
X\ + 2X2 + 3^3 


XI + 2X2 = 

x 2 + x 3 = 
3a;i + x 2 + 5 x 3 = 


6 

9 

10 


(b) 


3 

1 

0 
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Usar la Regia de Cramer para resolver los sistemas: 

2 x — y — z = 4 | x + y + 2 z = — 1 

(b) 2x — y + 2z = —4 
4x + y + 4z = —2 


(a) 3x + 4y — 2z = 11 

3x — 2y + 4z = 11 


Un sistema de ecuaciones de matriz A £ tiene 5 grados de libertad. 

Calcula rango(A). 

12] Utilizar el teorema de Rouche-Frobenius para realizar un estudio del 
niimero de soluciones de los siguientes sistemas y resolverlos: 


(a) 


(c) 


3xi + 2X2 + X 4 — x 3 = 
Xi + 2x 3 +x 5 = 

X\ + 2X2 — X3 = l 
X 2 + x 3 = 2 

Xi + 3x2 = 3 


(b) 


(d) 



XI + X 3 - X 4 
X 2 + X 3 + X 4 


En los siguientes apartados se da un nurnero x y una aproximacion x*. 
Encontrar los errores absoluto y relativo en cada caso. 

(a) x = 5; x* = 0.49 x 10 1 . 

(b) x = 0.704645; x* = 0.70466 x 10°. 


Resuelve el siguiente sistema mediante elimination gaussiana con y sin 
pivoteo partial, usando aritmetica de coma flotante con cuatro cifras significa- 
tivas. Despues encuentra la solution exacta y calcula los errores relativos de los 
valores calculados: 

2x\ + + ^x 3 = 1 

X\ + 2X2 — x 3 = 0 

6xi + 2x2 + 2x 3 = —2 

Hallar la factorization LU de las siguientes matrices 

/l 1 1 2\ / 1 -1 1 

12 13 1 . I -1 2-1 

1321 1-25 

2 2 1 1 . 0 2 2 


(a) 
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I3B1 Demuestre que el sistema 

Xi + X 2 = 50 

Xt + 1.0263:2 = 20 

esta mal condicionado si se usa aritmetica de coma flotante con dos cifras 
significativas. ^Cual es el error relativo cometido si lo comparamos con la 
solution exacta? 

| 2 J Obtener las tres primeras iteraciones del metodo de Jacobi para los 
siguientes sistemas usando = ( 0 , 0 , 0 ): 

3xi — X 2 + X 3 = 1 I 10xi — X 2 = 9 

(a) 3a;i + 6 x 2 + 2 x 3 = 0 > (b) — xi + 10 x 2 — 2 x 3 = 7 

3xi + 3x2 + 7x3 = 4 J —2x2 + IOX3 = 6 

I ami Repetir el ejercicio 9 empleando el metodo de Gauss-Seidel. 


Problemas 


I am ,/Puede existir una parabola que pase por los puntos (0,1), (1,3), (2,15) 
y (3,37)? 

QQ ^Para que valores de to el sistema 

2 x — y + z = 0 

x + my — z = 0 

x + y + z = 0 

tiene soluciones no triviales? 

|2£J Estudiar el sistema: 

4x + 2 y + z = Ax 
2x + Ay + 2z = A y 
2x + Ay + 8 z = A^ 

segiin los valores del parametro A. 

|3£] Discutir la compatibilidad de los sistemas siguientes segiin los valores 
de los parametros m y n. 


3x — 7 y 
x + y 
5x — 13 y 
x + 2 y 


m 

n 

5?n — 2 n 
to + n — 1 




(b) 


x — my + z 
x + y — z 
nx — 2y — 5 z 
2 x + y + z 


0 

0 

0 

0 
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I ami Construir un sistema lineal de tres ecuaciones y cuatro incognitas tal 
que su solution sea (1 — 2a — 3/3, a, 1 + 2/3, /3). 

KM Un sistema con tres incognitas y un grado de libertad tiene como 
soluciones las ternas (1,0,1) y (2, —1, —1). Encuentra todas las soluciones del 
sistema. 

|3U Encuentra la matriz cuadrada P tal que al multiplicar a la derecha por 
( x,y,z) T da ( y,z,x) T . /,Cual es su inversa? 

I2£j Resolver los siguientes sistemas usando la factorization LU: 


x - y + z 
—x + 2 y — z + 2 t 
x — y + 5z + 23 
2 y 2 z 63 



x + y 
(b) -y + 5z 

x + 2 y — z 


5 

2 

7 


I2JJJ Comprobar que el sistema 

X\ — X2 — ^3 — X4 — X5 — 0 
X2 — %3 — X4 — £5 = 0 

X3 — X4 — X5 = 0 

X4 — £5 = 0 
X 5 = 1 


esta mal condicionado, si se considera el sistema perturbado 


X\ — X2 — X3 — X4 — x$ = Q 

-ygaq + x 2 - x 3 - x 4 - x 5 = 0 
-jgaq + x 3 - x 4 - x 5 = 0 
-j^xi + x 4 - x 5 = 0 
-J 5 X 1 + x 5 = 1 


Ejercicios teoricos 

|3^lJ Probar la Proposition 3.1 

|2JJ Decidir si las siguientes afirmaciones son verdaderas o falsas: 

(a) Un sistema compatible indeterminado puede tener el mismo niimero de 
ecuaciones e incognitas. 

(b) Un sistema de n + 1 ecuaciones con n incognitas tal que el rango de su 
matriz ampliada sea n + 1 puede ser indeterminado. 
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(c) Un sistema compatible determinado puede tener mas incognitas que ecua- 
ciones. 

(d) Un sistema compatible determinado puede tener mas ecuaciones que 
incognitas. 

Construir un sistema lineal de matriz no nula con mas incognitas que 
ecuaciones que no tenga solution. ^Cual es el menor numero de ecuaciones e 
incognitas que puede tener? 

* iawci Considerese el sistema de ecuaciones Ax = b con A £ A4 n (K), 
x, b £ A1 n xi(K). Compruebese que las iteraciones del metodo de Gauss-Seidel 
equivalen a realizar las iteraciones 

x (fc+1) = c - Mx (k) 

con c = (D + L)~ 1 b y M = (D + L)~ 1 U, donde D, L y U son, respectivamente, 
una matriz diagonal, cuya diagonal corresponde a la diagonal de A, una matriz 
triangular inferior que corresponde a la parte triangular inferior de la matriz A, 
y una matriz triangular superior que coincide con la parte triangular superior 
de A, de tal modo que A = D + L + U. 

Ejercicios adicionales 

lawi Elaborar un programa en Python para resolver un sistema de ecuaciones 
usando el metodo de Gauss-Seidel empleando la descomposicion que aparece en 
el ejercicio 23. 

iaw.1 Modifica adecuadamente el codigo de la pagina 127 para poder resolver 
una ecuacion diferencial del tipo: 

—u"(x) + u{x) = f(x), x £ (0,1) 
u(0) = a, u( 1) = P 
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4 Espacios vectoriales 
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Los espacios vectoriales 1 son probablemente las estructuras matematicas 
mas comunes que podemos encontrar. Todos los fenomenos calificados como 
“lineales” en multitud de contextos estan vinculados de algun modo a un espacio 
vectorial, lo que da una idea de su importancia. Por otra parte, son estructuras 
muy sencillas que entranan una interesante diversidad de propiedades, algunas 
de las cuales veremos en este tema. 

Posiblemente el lector habra manejado con anterioridad el concepto de 
vector, bien sea como elemento geometrico para determinar direcciones, o bien 
como un objeto que permite representar determinadas magnitudes fisicas como 
la velocidad o la fuerza. En estos casos, el vector se representa como una “flecha” 
que determina unas caracterfsticas propias como son su modulo, direction 
y sentido. 2 Esta representation es util para “visualizar” ciertos conceptos y 
propiedades, pero es completamente inadecuada cuando tratamos con otro tipo 
de objetos que tambien son vectores, como veremos a lo largo de este tema. 


□ 1 - 

LA ESTRUCTURA DE ESPACIO VECTORIAL 

Con objeto de poder tratar cualquier tipo de vector con independencia de su 
naturaleza, usando simplemente las propiedades intrfnsecas que poseen debido 
a su pertenencia a un espacio vectorial, hemos de hacer un esfuerzo en tratar 
todos estos conceptos de forma abstracta; la definicion de espacio vectorial es 
una buena muestra de ello. Emplazamos al lector para que trate de entender el 
significado de la definicion a traves de los ejemplos que le siguen. 


1 E1 origen del concepto esta vinculado a los trabajos de matematicos del s. XVII en geo- 
metria analftica, matrices y sistemas de ecuaciones lineales, aunque la formulacion axiomatica 
actual se debe al matematico italiano Giuseppe Peano a finales del s. XIX, que habfa estudiado 
profundamente la obra del aleman Hermann Grassmann de mediados del mismo siglo, en el 
que de manera no formal se establecen las ideas principales de lo que hoy conocemos como 
Algebra Lineal. 

2 El concepto de segmento orientado o bipoint se debe al italiano Giusto Bellavitis en el 
s. XIX, aunque el nombre de vector fue introducido por el irlandes William Rowan Hamilton. 
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Un conjunto V se dice que es un espacio vectorial sobre el cuerpo K (o un 
abreviadamente un K-espacio vectorial) si existen en el las siguientes operacio- 
nes: 

una operacion interna ( suma ): 

+ : V x V —» V 

(x,y) —t x + y 

y una operacion externa (producto por escalar ): 

• : KxV 

(a,x) 

verificando: 


(I) 

U + V = V + u 


(II) 

u + (v + w) = 

(u + v) + ’ 

(III) 

U + 0 = 0 + u 

= u 

(IV) 

u+ (-u) = 0 


(V) 

1 • u = u 


(VI) 

a-(/3-u) = (ai 

3) ■ u 

(VII) 

(a + /3) • u = a 

• u + /3- u 

(VIII) 

a ■ (u + v) = a 

• u + a ■ v 



Observese que la definition necesita de la existencia de un determinado 
cuerpo K (nosotros usaremos R 6 C) y en funcion de este puede variar la 
estructura del espacio. Si K = R se llama espacio vectorial real y si K. = C se dice 
espacio vectorial complejo. Por simplicidad hablaremos simplemente de espacio 
vectorial (en adelante e.v.) sin hacer mention al cuerpo, siendo el contexto en 
el que trabajemos el que determine el cuerpo a usar (de forma generica K). 

Como se puede observar, la estructura de e.v. solo precisa de la existencia de 
un par de operaciones, y de que estas satisfagan una cuantas propiedades que 
imaginamos que el lector puede claramente identificar. A traves de los ejemplos 
que siguen a continuation nos daremos cuenta de que practicamente cualquier 
conjunto en el que se puedan realizar operaciones numericas tiene estructura de 


e.v. 
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A los elementos de un e.v. se les denomina vectores. 3 Los denotaremos por 
letras en negrilla, u, v,. . .El punto correspondiente al producto por escalares 
sera habitualmente omitido. 



(i) R" es un e.v. (real) con las operaciones siguientes: 

(xi, ...,x n ) + (yi, ...,y n ) = (xi +yi, .. .,x n +y n ) 
a ■ (xi,..., x n ) = (axi,..., ax n ) 

En particular, R (para n = 1), es un espacio vectorial sobre si mismo. Sin 
embargo, si el cuerpo escogido es C, en lugar de R, entonces R ra pierde la 
estructura de e.v., pues la operacion producto por escalar de un elemento 
de R" con un niimero complejo no resulta, en general, un elemento de R™. 

(n) Ad m xn(K) es un e.v.sobre K con las operaciones suma y producto por es¬ 
calar dadas en la Definition 2.5 (tal y como confirman las Proposiciones 2.1 

y 2 . 2 ). 

(ill) R°° = {(a„)* t : sucesiones reales} es un e.v. con las operaciones 

{ a n)^Ll + (b n )^L 1 = (ttn + &n))}Ll 
a • (a„)£° =1 = (aa n )“ =1 

(iv) PJj[x] = {a 0 +aix + - • -+a n x n : a,i £ R}, es decir el conjunto de polinomios 
con coeficientes reales de grado menor o igual que n, en la variable x, es 
un e.v. con la suma y el producto habituales. 

(v) C(\a,b]) = {/ : [a, b] —> R : / continua} tambien es e.v. con la suma y 
producto habituales entre funciones. 

(vi) C es un C-espacio vectorial, y tambien es un R-espacio vectorial, pero la 
estructura de ambos espacios es distinta, como se vera posteriormente. 


Notese que ademas de los tipicos espacios R" hay una multitud de espacios 
vectoriales de naturaleza bien distinta formados por elementos de los mas diverso 
(funciones, polinomios, matrices, sucesiones, etc.). Lo mas destacado del hecho 
de que estos conjuntos sean espacios vectoriales es que las propiedades que 
vamos a tratar en este tema y los siguientes son aplicables a la estructura de 


3 Insistimos en el hecho de que, a partir de ahora, cualquier elemento de un e.v. es un vector. 
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estos espacios, y por tanto funcionaran en todos ellos con independencia del tipo 
de conjunto con el que tratemos. Es por ello la necesidad de abordar de manera 
abstracta estos conceptos. 


En contraste, veamos algunos conjuntos que no son espacios vectoriales. 



(i) P^*[a;] = {a 0 + a\x H- V a n x n : a* £ R, a n ^ 0}, es decir, el conjunto de 

polinomios con coeficientes reales de grado exactamente n en la variable x , 
no es un e.v. puesto que el producto del escalar 0 por cualquier polinomio 
de grado exactamente n nos proporciona el polinomio nulo, que ya no tiene 
grado exactamente n. Es decir, el producto por escalar con un elemento 
del conjunto no proporciona elementos del mismo conjunto, lo que lleva a 
que la dicha operacion no este correctamente definida en este conjunto. 

(il) Af^R) = {d£ Al 2 (R) : det(A) = 0}, no es un espacio vectorial puesto 
que las matrices 

1 °Wo „ 

0 0 j \0 1 

pertenecen a dicho conjunto, pero no asf su suma. 

(in) R^° = {(a rl )^L 1 : sucesiones reales con lnnite /}. Se propone al lector 
encontrar la causa. ^Existe algiin valor de l para el cual este conjunto 
si es un e.v.? 

Quizas estos ejemplos lleven a confusion en el lector, pues todos ellos son 
subconjuntos de conjuntos mayores que si son espacios vectoriales. Pero alii esta 
la clave de la comprension de una estructura matematica: esta es una propiedad 
del conjunto, no de algunos de sus elementos. 


A continuacion probaremos algunas propiedades simples que satisfacen los 
e.v. 



Sea V un e.v. Se verifican las siguientes propiedades: 
(i) El elemento neutro de un e.v. es unico. 

(il) El elemento opuesto de un e.v. es unico. 
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(in) 0 • u = 0, Vu e V. 

(iv) El elemento opuesto de u es (—1) • u. 

(v) a ■ 0 = 0, Va € K. 


Demostracion: 

Si bien la demostracion de estas propiedades es muy sencilla, el lector puede 
encontrarse con algunas dificultades en su comprension, principalmente por no 
estar familiarizado con la abstraction matematica precisa para llevarlas a cabo. 
En cualquier caso, es cuestion de practica conseguir entender los procedimientos 
habituales de demostracion. 

(i) Supongamos que Oj y O 2 son dos elementos neutros y probemos que ambos 
elementos son en realidad el mismo. Debido a la propiedad de neutralidad: 

Oi + 0 2 = Oi y 0 2 + Oi = 0 2 

Por la conmutatividad 

Oi + O2 = O2 + Oi 

y por tanto Oi = O 2 

( 11 ) Usarnos la misma tecnica que en el apartado anterior: si vi y V 2 son dos 
elementos opuestos de u, entonces 

(u + Vi) + v 2 = (v 2 + u) + Vi = 0 + Vi = Vi 
(u + V 2 ) + Vi = (u + Vi) + v 2 = 0 + v 2 = v 2 

y como (u + vi) + v 2 = (u + v 2 ) + Vi, se tiene que vi = v 2 . 

(iii) u = 1 • u = (0 + l)-u = 0-u + l-u = 0-u + u. Notese que toda esta cadena 
de igualdades se deduce de las propiedades que definen la estructura de 


Como consecuencia de lo anterior u = u + 0 • u, luego 0 • u es el elemento 
neutro, es decir, 0. 

(iv) u + (—1) • u = (1 + (—1)) • u = 0 • u = 0, de donde se deduce que (—1) • u 
es el opuesto de u. 

(v) a • 0 = a ■ (0 + 0) = a ■ 0 + a ■ 0, luego a ■ 0 = 0, y esto es valido Va € K. 
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Notese que el elemento nulo del e.v. es denotado genericamente como 0 , pero 
este depende del tipo de espacio en el que nos encontremos. Por ejemplo, en R", 
este elemento es el (0,..., 0), en A4 mX n(K) sera la matriz nula y en P#[x] sera 
el polinomio nulo, esto es p(x) = 0. En este ultimo caso es importante que el 
lector entienda lo que esto significa: el polinomio nulo es aquel cuyos coeficientes 
son todos nulos, es decir, la expresion p(x) = 0 no es una ecuacion en la que 
x es una incognita, sino una igualdad que tiene que ser cierta para todo x, de 
modo que el polinomio que la verifica es el polinomio nulo. 


□ 1 - 

INDEPENDENCE LINEAL 



Sea V un e.v. y sean v, Vi, ..., v„ vectores de V. Se dice que v es combination 
lineal (o que depende linealmente ) de v 1; ..., v„, si existen oq,... ,a n € K tales 
que 

V = ttlVl H- 1 - Q n V„ 

Se dira combinacion lineal no nula si algun on ^ 0. 


Sin duda alguna, una de las principals ventajas del Algebra Lineal es su 
simplicidad, debido precisamente a que las operaciones que podemos llevar a 
cabo con los vectores se reducen esencialmente a combinaciones lineales entre 
cllos. Como veremos, este concepto nos acompanara durante el resto de temas. 4 



(i) El vector nulo es combinacion lineal de cualquier conjunto de vectores. 

(il) Un vector cualquiera v siempre es combinacion lineal de cualquier conjunto 
de vectores que contenga al propio v. 


La demostracion es muy sencilla: se trata de escribir el vector nulo en el 
primer caso, o el vector v en el segundo, como combinacion lineal de cualesquiera 

4 Practicamente todos los conceptos que se estudian en este tema aparecen, aunque de 
forma imph'cita, en la obra central de Grassmann Die Lineale Ausdehnungslehre, ein neuer 
Zweig der Mathematik de 1844. No es hasta 1910 cuando el matematico aleman Ernst Steinitz 
ofrece una presentation rigurosa y practicamente definitiva de ellos. 
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otros vectores. ^Se le ocurre al lector como hacerlo? 



Se dice que los vectores vi,...,v n son linealmente dependientes (id.) si 
podemos escribir el vector 0 como combination lineal no nula de ellos. Dicho de 
otro modo, si existen escalares a±, ..., a n £ K no todos nulos tales que 


0 = aqvi H-h a„v n 

En caso contrario se dira que los vectores son linealmente independientes (l-i.), 
lo que ocurrira si cualquier combination lineal de los vectores Vj igualada al 
vector nulo, implica que todos los escalares deben ser nulos, es decir, 

0 = oqvi H-1- a„v„ =*> ai = • • • = a n = 0 


Probablemente el lector estara acostumbrado a entender la independencia 
lineal en un sentido geometrico (por ejemplo en R 2 , dos vectores son indepen¬ 
dientes si no son paralelos). Sin embargo el concepto se liace mas difitil de 
entender si trabajamos con otro tipo de espacios. La siguiente proposition nos 
permite entender la definition anterior a traves de una serie de propiedades de 
las que cabe destacar (i), la cual expresa a la perfection el significado de la 
dependencia lineal de vectores. 



(i) Si v 1; ..., v„ son vectores linealmente dependientes, existe algiin Vj que 
es combination lineal de los demas. 

(n) Todo conjunto finito de vectores entre los cuales se encuentre el vector 0 
es linealmente dependiente. 

(ill) Todo conjunto finito de vectores linealmente independientes no puede 
contener un subconjunto propio linealmente dependiente. 


Demostracion: 

(i) Por la definition de dependencia lineal existe una combination lineal no 
nula de estos vectores tal que 


am H-b a n v n = 0 
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Dado que la combinacion lineal es no nula, debe existir al menos un oq 7 ^ 0. 
Despejando de la expresion anterior Vj es claro que 

Vj = — (—aqvi — • • • — oij —1 Vj—r — aq+i v i+i — • ■ • — a n v n ) 
a j 

de modo que vy es combinacion lineal del resto. 

( 11 ) Obviamente, si el vector nulo forma parte de un conjunto de vectores, 
existe una combinacion lineal no nula de estos (la formada por todos los 
escalares nulos, menos el que multiplica al vector cero) que proporciona el 
vector nulo. Luego el conjunto es l.d. 

(in) Para probar este hecho usaremos una tecnica de demostracion conocida 
como reduction al absurdo , la cual consiste en suponer lo contrario de 
lo que queremos demostrar y deducir de aquf una contradiccion, lo que 
prueba que nuestra suposicion es falsa, y por tanto el resultado es cierto. 

Supongamos entonces que tenemos un conjunto de vectores {vi,...,v„} 
que es l.i. en el que existe un subconjunto propio que es l.d. Por simplicidad 
en la notation pongamos que el conjunto l.d. esta formado por los primeros 
k vectores, con k < n. Puesto que estos vectores son l.d., existe una 
combinacion lineal no nula, 

aqv! H-b OfeVfc = 0 

con algun ay 7 ^ 0. Entonces es evidente que 

aiVi + • • • + afcVfc + 0 • Vfc +1 + • • • + 0 • v„ = 0 

Esto es una combinacion lineal de los vectores Vi,..., v„ igualada al vector 
nulo, pero en el que hay escalares no nulos, lo cual es imposible, pues estos 
vectores son l.i. De esta contradiccion se sigue que nuestra suposicion sobre 
la existencia de un subconjunto propio l.d. es falsa. 


El siguiente resultado nos proporciona un metodo sencillo para detectar la 
dependencia o independencia de vectores de K ra (y como luego veremos, tambien 
se podra usar en otros espacios). 



Sea A S A4 mX n(lK) con rango(ti) = r. Entonces existen r filas (o columnas) 
de A linealmente independientes, esto es, hay r vectores de K™ correspondientes 
a sus filas (o de K m correspondientes a sus columnas) linealmente independien¬ 
tes, de manera que el resto se expresa como combinacion lineal de estas. 
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Demostracion: 


Consideremos A = (atj) una matriz de rango r. Para simplificar la notation 
supongamos que un rnenor de orden r no nulo se obtiene con las primeras r filas 
y columnas, 5 es decir, 


an 


a r i 





(4.1) 


Dividiremos la demostracion en dos pasos. 


(i) Probemos en primer lugar que los vectores de K” correspondientes a las 
r primeras filas de A, es decir, 

&i = (an, ..., ai n ), ..., s. r = (a r i, ..., a rn ) 

son l.i. 

Procederemos por reduction al absurdo. Supongamos que dicho conjunto 
de vectores es l.d. Por (i) de la Proposition 4.3 debe existir uno de ellos 
que sea combination lineal (no nula) de los restantes. Supongamos que es 
el a j. Entonces, 

slj = Qqai + • • • + cXj—iELj—i + Qy_|_i a j+i + • ■ ■ + a r & r 

Realicemos ahora la siguiente operation en el menor basico dado en (4.1) 

Fj — a\Fi — ■ ■ ■ — otj-\Fj_\ — ay+i-Fj+i — • • • — a r F r 

Puesto que las filas del menor coinciden con los vectores a;, obtenemos 
que la fila j-esima del menor es nula, y por tanto su determinante es cero, 
lo que es una contradiction con nuestra hipotesis initial, y asf los vectores 
deben ser l.i. 

(n) Veamos que el resto de filas depende linealmente de las r primeras. 
Consideremos k y l tales que r < k < m, 1 < l < n, y el menor basico de 
(4.1) al que orlamos con la fila A:-esima y la columna l-e sima, esto es 


an 

CL\r 

a-u 

a r i 

a rr 

CL r l 

Ofcl • 

&kr 

a-ki 


Esta claro que si l < r el determinante es nulo pues tendrfa dos columnas 
iguales; y si l > r, entonces correspondent a un menor de orden r +1, que 
tambien es nulo gracias a la hipotesis initial (esto es, rango(A) = r). 

5 Esto no supone restriccion alguna puesto que sabemos que el rango de una matriz no se 
altera por intercambio de filas y/o columnas. 
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Desarrollemos ahora este determinants por su ultima columna. Tendremos 

0 = (—l) r+2 aii|A 1 | + • • • + au\A r+ i\ 


Ahora bien, observemos que los A t son siempre iguales, con independencia 
del l escogido, y adernas |A r+ i| ^ 0. Por tanto, para cada l = 1 ,n, 
podemos escribir (despejando au ) 


Ofez — (—l) r+1 a;y 


l^il 

l-^r+ll 


+ • • • + a r i 


\Ar\ 

l-'^r+l I 


pero esto es lo mismo que 


a kl — OL\CL\\ + • • • + OL r a r 1 


& kn — Qt\CLin H - ‘ * H - 0(. r CL rn J 

donde a* = (—l ) r+z ■ De aqui se deduce que es combination lineal 
de ai,..., a r , y esto es cierto para cada k, r < k < n. 

Un argumento similar se emplea para la demostracion por columnas. 



Como consecuencia de este resultado podemos probar ahora la suficiencia en 
el Teorema de Rouche-Frobenius (Teorema 3.2). 

Si rango(A) = rango(A), eso significa, en virtud del Teorema 4.1, que la 
ultima columna de la matriz A, es decir el vector b, es combination lineal de 
las n primeras columnas de A 



es decir, 

b\ = a\\X\ + • • • + a\ n x n 


bm — 


ClmlXl “r * * ‘ T dmn^n 
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luego el sistema es compatible. 



(i) Estudiar la dependencia o independencia lineal de los vectores de R 3 : 
vi = (1,1, 3), v 2 = (0,1, 2) y v 3 = (1, 2, 5). 

Como hemos visto, basta estudiar el rango de la matriz cuyas filas (o 
columnas) corresponden a las coordenadas de los vectores dados, i.e., nos 
preguntamos por el rango de la matriz 




Como 


1 1 


1 

1 

3 

7^0 y 

0 

1 

2 

0 1 

1 

2 

5 



= 0 


los vectores Vi y v 2 son linealmente independientes y el vector V 3 es 
combination lineal de ellos. 


Notese que tambien se tiene que los vectores v 2 y V 3 son independientes 
(y Vi es combination de ellos), pues la matriz formada por las dos ultimas 
filas tambien tiene rango dos. 


( 11 ) Comprobar que el conjunto de vectores de P^N, {1, x,..., x n }, es lineal¬ 
mente independiente. 

Notese que en este caso no podemos construir matriz alguna, por lo 
que es preciso acudir a la definition de independencia lineal. Es decir, si 
consideramos una combination lineal de estos vectores igualada al vector 
nulo, debemos deducir que los escalares son todos nulos. En efecto, 


«o + x + • • • + a n x n = 0 


es una igualdad entre polinomios (jno una ecuacion en x\, pues el vector 
nulo de los polinomios es el polinomio cero). La unica posibilidad de que 
estos dos polinomios sean iguales es que sus coeficientes lo sean, luego 
a 0 = a 1 = ■ ■ ■ = a n = 0 , es decir los escalares son todos nulos, lo cual 
prueba la independencia. 
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(ill) Comprobar que el conjunto de vectores de C([0, 27 t]), {1, sen 2 x, cos 2 x}, es 
l.d. 

Sabemos por la formula fundamental de la trigonometrfa que cos 2 x + 
sen 2 a: — l = 0. Luego tenemos una combination lineal no nula de estos 
vectores igualada al vector cero de este espacio (la funcion nula). 



Se denomina rango de un conjunto de vectores al mayor niimero de cllos que 
son linealmente independientes. 


Logicamente, en el caso de vectores de K n , el rango de un conjunto de 
vectores coincide con el de la matriz que forman. 


Una primera consecuencia del Teorema 4.1 es la siguiente: 



En K", todo conjunto de vectores formado por n + 1 vectores es linealmente 
dependiente. 


La demostracion es inmediata, pues el rango de una matriz formada por 
n+1 vectores de K n es, como maximo, n. Al no poder tener rango n+1, los 
vectores no pueden ser independientes. 


□ 1 - 

BASES Y DIMENSION DE UN ESPACIO VECTORIAL 

El concepto de base es posiblemente el elemento mas importante con el que 
nos encontramos en un espacio vectorial. Antes de llegar a el precisamos de la 
siguiente definition. 
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Sea V un e.v. Un conjunto de vectores vi,..., v„ se dice sistema generador 
(o conjunto generador) de V si cualquier vector u € V se puede poner como 
combination lineal de ellos. 


En cierto modo, podemos entender un sistema generador como la “semilla” o 
los “padres” de un espacio vectorial, de tal modo que, realizando combinaciones 
lineales con sus elementos somos capaces de construir cualquier otro vector del 
espacio. 



(i) En R 2 , el conjunto {(1,0), (0,1)} es un sistema generador. Para compro- 
barlo escogemos un vector arbitrario de R 2 , (xi,x 2 ) y tratamos de escri- 
birlo como combination lineal de los anteriores. Esto es, 

{xi,x 2 ) = a(l,0) + /?(0,1) 

Un simple calculo nos demuestra que a = x\ y /3 = x 2 . Es decir, dado 
cualquier vector somos capaces de encontrar una combination lineal de 
elementos de nuestro conjunto que nos permiten obtener el vector dado. 

(n) El conjunto formado por (1,0) y (2,0) no es sistema generador de R 2 , pues 
si tratamos de repetir lo anterior 

(x!,x 2 ) = a(l, 0) + /3(2,0), 

se obtiene que x 2 = 0. Es decir, no cualquier vector de R 2 es combination 
lineal de los anteriores (lo son unicamente aquellos vectores cuya segunda 
componente es cero), y por tanto no generan todo el espacio. 


El concepto de sistema generador tiene una enorme trascendencia, pues nos 
va a permitir estudiar las propiedades de un espacio “mirando” solo a sus 
generadores. Sin embargo adolece de un pequeno problema que se muestra en 
el siguiente resultado. 
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Sea S un sistema generador de un e.v. V. Si S = Si U <S>2, con Si y S2 
conjuntos disjuntos 6 tales que los elementos de S2 se escriben como combinacion 
lineal de los elementos de <Si, entonces es sistema generador. 


Demostracion: 

Consideremos S = {ui,..., u*, uj+i,..., u m }, donde 

Si = {ui,...,uj}, S 2 = {u 2+1 ,... ,u m } 


y supongamos que cada Uj, l + 1 < j < m es combinacion lineal de los vectores 
de Si, es decir, 

1 

", = J2 r 'J u ' 

i= 1 

Como S es sistema generador, dado u £ V cualquiera, u es combinacion lineal 
de los u,;, 1 < i < m. Entonces, 


m l m l m / l 

u = a o xi j = 'y a j u j + /* a j u j = y a j u j + y a j ( y 

j —1 3 —1 j=l +1 J=1 3=i+l \»=1 


= a J U J +J 2 \ a O X ij ) u ' = 
j —1 *=1 V j=i+i 


*:=1 


H/c “t“ y ' OtkXkj J Hfc 
1 = 1+1 


es decir, u es combinacion lineal de los elementos de Si. Como el razonamiento 
se ha heclro para un vector u arbitrario, significa que es cierto para todos, y por 
tanto Si es sistema generador. 


Lo que prueba este resultado es que si tenemos un conjunto que es siste¬ 
ma generador en el cual existe uno o mas vectores que son combinacion lineal 
de otros vectores del conjunto, podemos suprimirlos y seguimos teniendo un 
sistema generador. Dicho de otro modo, en los sistemas generadores podemos 
encontrarnos vectores que no son necesarios para generar el espacio, pues si los 
eliminamos, seguimos teniendo un sistema generador. Esto plantea un inconve- 
niente a la hora de trabajar con un sistema generador, pues puede haber vectores 
en el mismo que sean innecesarios. Para resolver este pequeno problema aparece 
el concepto de base. 


Esto es, cSi PI >S 2 = 0- 
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Sea V un e.v. Un conjunto finito de vectores {ei,... e„} es una base de V 
si es un conjunto linealmente independiente y sistema generador. 


A la vista de lo comentado anteriormente, para evitar los problemas de 
“exceso de vectores” en los sistemas generadores lo que hacemos simplemente 
es quedarnos con aquellos que sean linealmente independientes (recuerdese (ill) 
de la Proposition 4.3). 



(i) En R n , el conjunto {e l5 ..., e rl } donde e, = (0,..., 1,..., 0) (un 1 en la 
componente i) es una base de R ra . 

En efecto, para ver que es l.i. solo debemos estudiar el rango de la matriz 
formada por los vectores. Es inmediato comprobar que dicha matriz es la 
identidad, que tiene rango n, por lo que el conjunto es l.i. 

Para ver que es sistema generador tratamos de escribir un vector arbitrario 
de R n como combination lineal de ellos: 

(&i,... ; ^n) — oqei + • • • + cx n Q n 

Un simple calculo nos lleva a que Xi = cti, Vi. Luego este conjunto tambien 
es sistema generador. 

(n) El conjunto {1, x,..., x n } es una base de Pg[x]. 

(ill) El conjunto 



es una base de A42(R). 

Se propone al lector que demuestre que los dos ultimos conjuntos son base 
de sus respectivos espacios. 


Todas las bases que aparecen en el ejemplo 4.5 son denominadas bases 
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canonicas , por la especial simplicidad con la que generan el espacio. Observese 
la facilidad en la comprobacion de que cada uno de ellos es sistema generador. 


—[” 



Sea B = {u 1? 
unicos ai,..., a n 

... u n } una base de un e.v. V. Entonces Vu £ V existen unos 

S K tales que 

u = aqU! H-b a n u„ (4.2) 


Demostracion: 

Puesto que B es una base, en particular es un sistema generador, y por tanto la 
existencia de los esta trivialmente garantizada. 

Veamos que son unicos. Para ello supongamos que existen oti, Pi, 1 < * < n 
tales que 

u = oqui -|- b a„u„ 

U = PiVLi H-b Pn.Un 

Restando ambas expresiones, 


0 — (ai — /3i)u! + • • • + ( a. n — /3„)u„ 

Esto es una combination lineal de los elementos de B igualada al vector cero. 
Como el conjunto B es l.i., se tiene que 


oil Pi — * — ot n P n — 0 

Luego ai = Pi Vi, de donde se tiene la unicidad. 



A los escalares oq,..., a n de (4.2) se les denominan coordenadas de u en la 
base B, y se notara por 

U0 = (oq, . • • , a n )s 
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Cuando no haya posibilidad de confusion omitiremos el subfndice. 

La trascendencia de este resultado es enorme, pues lo que nos asegura es 
que las bases son sistemas generadores que generan el espacio de forma unica. 
Es decir, cada vector tiene asociado un unico “identificador” (una especie 
de D.N.I.), que son sus coordenadas, que corresponden a los escalares de la 
combination lineal respecto de la cual escribimos el vector. 



(i) Consideremos el vector (1,—2,3) £ R 3 . ^Cuales son sus coordenadas 
respecto de la base canonica de R 3 , B c = {(1, 0, 0), (0,1, 0), (0, 0,1)}? 
Bastara observar que 

(1, -2,3) = 1 • (1,0,0) + (-2) • (0,1,0) + 3 • (0,0,1) 

En general, las coordenadas de un vector x = (aq,..., x n ) £ R" respecto 
de la base canonica de este espacio son precisamente (aq,..., x n ). 

(n) ^Cuales son las coordenadas del vector (1,—1,0) respecto de la base 
B = {(2, 0,1), (1,1, 2), (0, 0, —1)}? En este caso hemos de encontrar unos 
escalares oq, 012 , 0:3 tales que 

! 2aq + 02 = 1 
0 2 = -1 

oq + 2a 2 - a 3 = 0 

de donde se obtiene a\ = 1 , a 2 = — 1 , 0:3 = — 1 , es decir ( 1 ,— 1 , 0 ) = 
( 1 ,- 1 ,- 1 ) B 

(ill) ^Cuales son las coordenadas del polinomio 1 + 3x — 2x 2 £ P^[x] respecto 
de la base canonica {l,x,x 2 }. Nuevamente escribimos 

1 + 3a: — 2a : 2 = 1 • 1 + 3 • x + (—2) • a ; 2 

resultando que las coordenadas son (1,3,—2). Notese como los vectores 
de Pjjj[a:] pueden identificarse con vectores de R 3 . Reciprocamente, si nos 
dan un vector de Pjj [x] cuyas coordenadas respecto de la base canonica son 
(—1,0, 2), en realidad nos estan dando el polinomio 2a : 2 —1. Es fundamental 
resaltar la importancia del orden de los vectores de una base. Si en lugar 
de usar la base canonica { 1 , x, x 2 } estamos usando la base {x 2 , x, 1 } (jque 
no es la misma!), entonces el vector (— 1 , 0 , 2 ) corresponderfa al polinomio 
2 — x 2 . 
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Gracias al uso de coordenadas, estudiar la dependencia lineal de un conjunto 
de vectores que no esten en K" resulta mas sencillo que lo que hicimos en (il) del 
ejemplo 4.3. Por ejemplo, para ver si el conjunto { x 2 + 1,1 4-a; 3 , —x} C P|[:r] es 
o no l.i., podemos simplemente escribir los vectores mediante sus coordenadas 
respecto de la base canonica, resultando {(1, 0,1, 0), (1, 0, 0,1), (0, —1,0, 0)} y 
estudiar el correspondiente rango de la matriz (como si fueran vectores en R 4 ): 

(' ° 

rango 1 0 

V° 1 

lo que indica que son independientes. 


Veamos a continuacion algunos consecuencias interesantes del hecho de que 
existan bases en un e.v. 




Supongamos que el e.v. V posee una base formada por n elementos. Enton- 
ces, todo conjunto de m vectores, con m > n es l.d. 


Demostracion: 

Sea {ui,... u n } una base de V. Sean xi,...,x„,x n+ i, n+ 1 vectores de V. Por 
el teorema anterior, cada x, es combinacion lineal unica de la base, luego 

n 

Xj =y^ j x ij u j , i = 1,..., n + 1 (4.3) 

2=1 

Veamos que estos n+1 vectores son l.d. Para ello consideramos una combinacion 
lineal igualada al vector nulo: 


GpX;L 4“ * * * 4~ «nX„ 4“ O n -|-iX n _|_i — 0 


Usando (4.3), 


Gq ^ ( X±j\lj J 4“ ' * ' 4“ Oi n ^ ( X n jUj J 4“ G n _|_i y ( ■!'n ■ ] .7u, 
Agrupando terminos, 

/n +1 \ /n +1 \ 

I a j x jl j U 1 4- ■ ■ - 4- I a j x jn I Un = 0 


= 0 


G=1 


G=1 
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Como ui,..., u„ forman base, son l.i., por tanto cada uno de los escalares de la 
anterior combination lineal es nulo, esto es 


ot\Xn + • • • + cx n x n i + a n+ iX n+ i t i — 0 


(X\X\n "b * * * “b 0/. n X nn "b CTn+l*^n+l,n — 0 


Ahora bien, esto es un sistema homogeneo de n ecuaciones con n + 1 incognitas 
(los a.i). Como el rango de la rnatriz de los coeficientes es estrictamente menor 
que el nurnero de incognitas, es un sistema compatible indeterminado; por tanto 
posee solution distinta de la trivial. Es decir, existen a, no todos nulos tales que 
se verifica (4.3). Luego el conjunto formado por x 1; ..., x„, x„ +1 es l.d. 

Asi, hemos probado que cualquier conjunto de n +1 vectores siempre es l.d., 
luego si m > n, cualquier conjunto de m vectores tambien es l.d. (cf. (ill) de la 
Proposition 4.3). 

■ 

Este resultado admite una prueba mas sencilla si usamos coordenadas res- 
pecto de una base y el Teorema 4.1. ^.Podri'a el lector llevarla a cabo? 

Como consecuencia inmediata de este resultado, se tiene el siguiente: 



Todas las bases de un e.v. poseen el mismo nurnero de elementos. 



Se llama dimension de un espacio vectorial V al nurnero de elementos de 
cualquiera de sus bases, y se notara por dim(E). 



Por convenio se considera que el espacio vectorial V = {0} tiene dimension 


cero. 
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Atendiendo al ejemplo 4.5, es inmediato obtener las dimensiones de los 
espacios mas comunes: 

(i) dim(Pjj[a;]) = n + 1. 

(n) dim(K n ) = n. 

(hi) dim(A4 mXn (IK)) = m ■ n. 


Una vez que liemos establecido la importancia de las bases veamos como de 
una forma sencilla podemos comprobar que un conjunto es base de un e.v. 



Sea V es un e.v. de dimension n. Todo conjunto de n vectores l.i. forma una 
base de V. 


Demostracion: 

Puesto que {vi,..., v„} es un conjunto l.i. de V, para probar que es una base 
solo es necesario comprobar que se trata de un sistema generador. 

Sea entonces u £ V. Por la Proposition 4.5, el conjunto {v 1; ..., v„, u} es 
l.d. Por definition de dependencia lineal existen a±, ..., a n , a ra +i no todos nulos 
tales que 

aivi H-h a n v„ + a n+ iu = 0 

De todos ellos, a n +i no puede ser nulo, pues si lo fuera, tendri'amos una 
combination de los v, ( igualada al vector cero, y como estos son l.i., todos los 
escalares tendrfan que anularse. Al ser a„+i 0, podemos escribir 

G?i (X. n 

u =- Vi - v n 

&n -\-1 Q ^ n+1 

Es decir, hemos escrito un vector arbitrario u como combination lineal de los 
Vj, por tanto son sistema generador, como querfamos demostrar. 

■ 

La consecuencia de este resultado es bien simple: para comprobar que un 
conjunto es base solo necesitamos que sea l.i. y que tenga tantos elementos 
como la dimension del espacio en el que nos encontremos; automaticamente 
sera sistema generador y por tanto base. 

Para finalizar esta section veremos una serie de resultados que nos dicen 
que podemos hacer cuando tenemos conjuntos con mas o menos vectores que la 
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dimension del espacio. 


Proposition 4.7 (Ampliation de bases) 


Sea V un espacio vectorial de dimU = n. Si {vi,..., v*,} con k < n, es un 
conjunto l.i. entonces existen n — fc vectores, Vfc +1 ,..., v„, tales que el conjunto 
{vi,..., v fc , v fc+ i,..., v„} es una base de V. 


Demostracion: 

Como k < n debe existir al menos un vector que sea l.i. con vi,..., v*, (en 
caso contrario cualquier vector se escribiria como combination lineal de ellos, y 
por tanto tendriamos un conjunto l.i. que es s.g., es decir una base). Repetimos 
el proceso anadiendo un nuevo vector v k+2 al conjunto l.i. {vi,..., v k , v fc+i}- 
El proceso termina cuando juntemos n vectores, ya que tendriamos n vectores 
l.i. en un espacio de dimension n. 


Dado el conjunto de R 3 , (1,0,1), (2,1,1), ampliarlo hasta conseguir una base 
de este espacio. 

Comprobamos en primer lugar que son l.i. Para ello solo es necesario estudiar 
el rango de la matriz correspondiente 


rango 


( l 

0 

i\ 

= 2 pues 

1 

0 

V 2 

i 

V 

2 

1 


^0 


Para ampliar a una base, precisamos 3 — 2 = 1 vector que sea l.i. con los 
anteriores, es decir, tal que el rango de la matriz 


rango 



= 3 


En este punto, es evidente que podemos tomar infinitos vectores distintos que 
completan a una base. En tales casos conviene tomar vectores “sencillos”, que 
tengan un gran nurnero de ceros, Una posibilidad seria el vector (0,0,1). Notese 
que esta election se ha hecho en funcion de un menor de orden dos distinto de 
cero formado por los vectores dados. 
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Si S es un sistema generador de un e.v. V de dimension n, entonces existe 
un subconjunto de S que es base de V. 


Demostracion: 

Sea Ui £ S, Ui / 0 (siempre existira tal vector, a menos que V = {0}, en 
cuyo caso no hay nada que probar). Consideremos ahora u 2 £ S l.i. con iq (un 
tal elemento siempre existe, pues en caso contrario el resto de elementos seri'a 
combination lineal, y por tanto iq ya seri'a sistema generador, y l.i., es decir, 
una base). Reiteramos el procedimiento hasta obtener un conjunto de vectores 
de S l.i. Por el comentario anterior, este conjunto sera una base de V. 


El siguiente corolario resume los resultados anteriores: 



Si V es un e.v. con dim V = n, se tiene: 

(i) Todo conjunto de n vectores l.i. es una base. 

(n) Todo conjunto con mas de n vectores es l.d. 

(ill) Todo sistema generador tiene al menos n elementos. 
(iv) Todo sistema generador de n elementos es una base. 


Los resultados anteriores hacen referencia a las propiedades de las bases, 
pero en ningun momento hemos establecido que tales bases existan en cualquier 
espacio vectorial. De hecho, hemos de distinguir entre dos tipos de espacios, 
aquellos en los que existen bases, que son los espacios de dimension finita , y 
espacios en los que no existen bases, que son los espacios de dimension infinite , 
que definimos a continuation. 



Un conjunto infinito de vectores de un e.v. V es l.i. si cualquier subconjunto 
suyo es l.i. Si existe un tal conjunto se dira que V es de dimension inftnita. 
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(i) Pr[cc] = {polinomios con coeficientes reales en la variable x } es un espa- 
cio vectorial de dimension infinita. Basta comprobar que la familia 


es lincalmente independiente. 

(n) En C([0, 27r]), la familia {sen(rax), cos(raa:)} ne N es l.i., luego C([ 0, 27t]) es 
un espacio de dimension infinita. 



Es importante resaltar que en los espacios de dimension infinita no existen 
coordenadas, pues no hay bases. 


La importancia de los espacios de dimension infinita es grande, sin embargo 
constituyen un paso mas en el estudio de estructuras matematicas, por lo que 
practicamente no son considerados a lo largo del texto. 


□ El _ 

CAMBIOS DE BASE 

Si atendemos a (n) del ejemplo 4.6 vemos que un mismo vector tiene 
coordenadas distintas respecto de diferentes bases. En esta section pretendemos 
relational' las coordenadas de un vector cuando usamos bases distintas. Para 
olio consideremos dos bases de un e.v. V de dimension n: 

B= {ei,...,e n }, B' = {e' 1; ..., e'J 

Cada uno de los vectores de B' se puede escribir como combination lineal de los 
vectores de B de forma unica (cf. Teorema 4.3), es decir, 

e i = On e i + • • • + a n ie n \ n 

: \ Le - e j = ai i ei ( 4 - 4 ) 

. »=l 

e n — a ln^l + ■ • • + CL nn e n J 

Con las coordenadas de cada uno de los vectores de B' construimos la matriz 
A € M„(K), dada por A = (). Es importante observar como esta construida 
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diclia matriz: la columna j-esima de A corresponde a las coordenadas 
del vector e' respecto de la base B. A esta matriz se le denomina matriz 
del cambio de base de B' a B,y se notara por Mg, 6 M{B'\B). 

^Que relacion mantienen las coordenadas de un vector respecto de ambas 
bases? 

Escribamos las coordenadas de un vector respecto de la base B por xg y sus 
coordenadas respecto de B' por xg,. Es decir, 

n n 

xg = '^2x l e i , xg, = (4-5) 

i=i i=i 


Usando (4.4), 


n / n 


Xg, — ~ ^ x i a ijJ e i 

Comparando el ultimo termino de la expresion anterior con (4.5) (puesto que 
las coordenadas son unicas), resulta que 

n 

ajjz'- 

i=i 

Si ahora recordamos la definicion del producto de matrices, resulta que 


xg = M|,x g, 


(4.6) 


que son las denominadas ecuaciones del cambio de base de B' a B. 



La notacion de las ecuaciones del cambio de base puede ser un tanto confusa 
pues estamos habituados a escribir los vectores x = (aq,..., x n ) como una ma¬ 
triz fila. Sin embargo, la expresion (4.6) solo tiene sentido cuando expresamos xg 
y xg, como vectores columna (para poder hacer correctamente la multiplicacion 
matricial). En todo lo que sigue, en cualquier operacion que involucre la multi¬ 
plicacion matricial de vectores consideraremos estos como matrices columna, de 
modo que cuando tengan que ser multiplicados por filas usaremos su traspues- 
ta, es decir, x T . Cuando no haya multiplicaciones, seguiremos escribiendolos por 
filas. 
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Con las notaciones anteriores, la matriz del cambio de base de B' a B es 
invertible y su inversa es la matriz del cambio de base de B a B'. 


Demostracion: 

Puesto que los vectores de B' son l.i., ya que forman base, si escribimos la matriz 
de sus coordenadas respecto de la base B , esto es la matriz A , debemos tener 
que rango(ti) = n. Esto es, |ti| ^ 0, y por tanto A es invertible. 

Sea ahora A' = , con A' = (oC), donde, por definition, 

n 

e j = 'y ' a ij e i 

i=l 


Usando (4.4) se tiene que 

n / n \ n / n \ 

e j = y ] a ij ( y ] a ki e k I = y ] ( y ] oysti j &k 

»=1 \fc=l / fc= 1 \i=l / 

n 

Como las coordenadas son unicas, akidj-j = $kj, donde Skj es el si'mbolo de 

i=l 

Kronecker. 

Pero esta suma representa al elemento jk de la matriz AA'. Es decir, 
A A' = luego A' es la inversa de A. 


— ^ - 

(i) Consideremos la base canonica de R 3 , B c = {ei,e 2 ,e 3 } con 

er = (1,0,0), e 2 = (0,1,0), e 3 = (0,0,1) 
y el conjunto B = {uj, u 2 , u 3 }, con 


ui=ei+e 3 , u 2 =e 2 , u 3 = e 2 + e 3 

Para encontrar las ecuaciones del cambio de base de B a B c o viceversa, 
primero tenemos que encontrar la relation entre los vectores de ambas 
bases. Dado que los vectores de la base B estan escritos respecto de la 
base canonica, esto es, 

ur = (1,0,1), u 2 = (0,1,0), u 3 = (0,1,1) 
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obtenemos de forma inmediata la matriz del cambio de B a B c , es decir, 


Afn = 




Para encontrar las coordenadas del vector x = 3ui + 2u 2 = (3, 2,0)g en 
la base canonica hacemos uso de las ecuaciones del cambio de base, esto 
es xg c = Mf‘x s . Asf, 


/l 0 0 
= 10 11 
yi 0 1 




Si ahora tenemos un vector x = (2,1,—3) respecto de la base canonica, 
icomo calcular sus coordenadas respecto de la base B ? En este caso 
podemos buscar escalares tales que 


(2,1, -3) = ttl (l, 0,1) + a 2 (0,1,0) + a 3 (0,1,1) 

y resolver el sistema, tal y como hicimos en (n) del ejemplo 4.6; o bien 
usamos las ecuaciones del cambio de base del siguiente rnodo: 





y resolvemos el sistema, resultando x 
anterior equivale a 



(2,6, — 5)g. Notese que el sistema 



que corresponde al cambio de base inverso. Es decir, la matriz M® es 

« c )- 1 

(il) Consideremos ahora las bases 


Bi = {ei,e 2 ,e 3 }, B 2 = {ui, u 2 , u 3 }, B 3 = {v!,v 2 , v 3 } 
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donde 


ui = 2ei + e 2 vi = u 2 + u 3 
u 2 = ei - e 2 v 2 = ui — 2u 2 

u 3 = ei - e 3 v 3 = 2u 2 - u 3 


y el vector x = e 3 + e 2 + e 3 . ^Cuales son las coordenadas de este vector 
en cada una de las bases? 

Observemos en primer lugar que las coordenadas de x en la base B\ son 
inmediatas: xg t = (1,1,1). Para calcular las coordenadas en las otras 
dos bases haremos uso de la informacion proporcionada para construir las 
matrices de cambio de base. Dado que nos dan los vectores de la base S 2 
en funcion de los vectores de la base B\, es facil encontrar la matriz del 
cambio de base de 0 2 a B\ (poniendo las coordenadas por columnas): 



Y por el mismo motivo, 



M bI = 1 2 2 

\ 1 0-1 


Para obtener las coordenadas de x en la base B 2 usamos la matriz del 
cambio de base del siguiente modo; denotando por xg 2 = (x±, X 2 , X 3 ) 



Y procediendo de igual modo, si xg 3 = ( 2 / 1 , 3 / 212 / 3 ), 


( 


0 1 0 


1 -2 2 


1 0 -1 



^ X 03 — ( 0 , 1 , 1 ) 


^Podria el lector encontrar la matriz del cambio de base de B\ a B 3 I 
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nm - 

SUBESPACIOS VECTORIALES 


La ultima section de este tema esta dedicada a los conjuntos que mas vamos 
a usar de ahora en adelante, los subespacios vectoriales. 



Sea V un e.v. sobre un cuerpo K y W C V un subconjunto suyo. Se dice 
que W es un subespacio vectorial (o variedad lineal) de V si W es un espacio 
vectorial sobre K con las operaciones definidas en V. 


La definition de subespacio vectorial es un tanto confusa, pues en realidad no 
es mas que un espacio vectorial que “vive” dentro de otro, que habitualmente 
denominaremos espacio ambiente. Puesto que las operaciones definidas en el 
espacio ambiente satisfacen las propiedades oportunas para ser e.v. (vease la 
Definition 4.1), la clave para que un subconjunto W sea subespacio vectorial es 
que las operaciones se mantengan definidas dentro del conjunto, es decir, que la 
suma de vectores de W sea un vector de W y que el producto de un escalar por 
un vector de W permanezca en W. El siguiente resultado expresa justamente 
esto. 



W es un subespacio vectorial si y solo si au + /3v G W, Vu, v G W, a, /3 G K. 


La demostracion es inmediata, y se propone como ejercicio al lector. 



(i) El conjunto {(x\,X 2 ) GK 2 : X 2 = 0} es un subespacio vectorial de R 2 . 

Para comprobarlo, consideremos un par de elementos cualesquiera del con¬ 
junto. Dada la naturaleza del mismo, dos elementos genericos del conjunto 
seran algo del estilo (cc, 0), (y, 0). Tomemos ahora una combination lineal 
arbitraria de estos dos elementos: 

a{x, 0) + fi(y, 0) = (ax + /3y, 0) 

Es evidente que el elemento (ax+Py, 0) pertenece al conjunto, cualesquiera 
que sean a y /3; esto prueba que dicho conjunto es subespacio vectorial. 
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(n) El conjunto {(£ 1 , 0 : 2 ) € K 2 : £2 = 1 } no es subespacio vectorial de R 2 . 

Si tratamos de repetir el argumento anterior considerando un par de 
elementos arbitrarios del conjunto, (x, 1 ), (y, 1 ), ahora vemos que una 
combination lineal de los mismos, 

at(x, 1) + 0(y, 1) = (ax + (3y,a + 0) 

no es, en general, un elemento del conjunto. En concreto, si tomamos 
valores a y 0 tales que a + 0 7 ^ 1 , la combination lineal resultante no 
pertenece al conjunto, y por tanto este no es subespacio vectorial. 

(ill) Pr[x] es un subespacio vectorial de Pr[x]. 

(iv) Pr[x] es un subespacio vectorial de C(R). 

(v) {0} es un subespacio vectorial de cualquier e.v. 



Sean u 1; ..., u*, vectores de un e.v. V. Se define el conjunto 


( k 

W = L(ui,..., Ufe) = (ui, ■ • ■ 1 Ufc) = S = ai G K 

es decir, el conjunto de todas las posibles combinaciones lineales que se pueden 
hacer con los vectores dados. Este conjunto se denomina subespacio engendrado 
por u 1; ..., Ufe y a tales vectores se les denomina sistema generador de W. 


Proposition 4.10 


W = L(ui,..., Ufe) es un subespacio vectorial de V. 


Demostracion: 

Para la prueba usaremos la Proposition 4.9. Sean u, v £ W, y sean a, 0 £ K. 
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Veamos que au + /3v esta en W. En efecto, 


cm + /3v = a 




k 

+ P/3i)ui £ W 

i =1 


Notese que denominamos sistema generador a un conjunto de vectores de 
V que no es sistema generador de V, sino de un subespacio. Pero el nombre es 
consistente con el significado de sistema generador: un conjunto que genera el 
subespacio. 



(i) En R 3 , estudiar el espacio vectorial generado por los vectores Ui = (1, 0,1), 
u 2 = (— 1 , 1 , 0 ) y u 3 = ( 1 , 1 , 2 ). 

Puesto que estos tres vectores conforman un sistema generador de L = 
(Ui, 112 , 113 ), en primer lugar estudiamos la dependencia lineal entre los 
mismos. Asi, 


rango 




pues 



^0 y 


1 

-1 

1 


0 1 
1 0 
1 2 


= 0 


lo que significa que los vectores Ui y U2 son l.i y que 113 es combination 
lineal de ellos. Es decir, Ui y u 2 generan todo L , y puesto que son l.i. 
forrnan una base de L. La dimension de L sera por tanto 2 (el numero de 
elementos de una base), y (ui,u 2 ,u 3 ) = (ui,u 2 ). 

Es importante que el lector asimile correctamente estos conceptos que 
pueden ser un tanto confusos al principio. Observese que el conjunto 
{ui,u 2 } es base de L pero no es base de R 3 (pues genera L, pero no 
R 3 ). Podemos incluso usar coordenadas en L; por ejemplo, el vector 
u 3 = 2ui + u 2 , tiene coordenadas (2,1 )l respecto de la base dada en 
L. Aunque pueda parecer extraiio que solo haya dos coordenadas, hemos 
de tener en cuenta que el subespacio L es de dimension 2. 

( 11 ) Sea ahora L = L(ui, u 2 , u 3 ), con Ui = (1,0,1), u 2 = (1,1,1) y u 3 = 
(0,1, 2). Nuevamente estudiamos el rango del conjunto de vectores dado, 


= 3 


rango 


1 0 1 
1 1 1 
0 1 2 
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lo que indica que los tres vectores son l.i. Como estamos en M 3 , cuya di¬ 
mension es 3, estos vectores forrnan una base (recuerdese el Corolario 4.5). 
Es decir, este conjunto de vectores es sistema generador de todo el espacio 
R 3 , luego I/(ui,u 2 , u 3 ) = R 3 . 


Hernos visto como construir subespacios a partir de un conjunto de vectores. 
El siguiente resultado nos muestra otra forma habitual de definir subespacios. 



Sea A £ A4 mX n(K), con rango(A) = r. El conjunto de soluciones del 
sistema homogeneo Ax = 0 es un subespacio vectorial generado por cualesquiera 
k — n — r soluciones linealmente independientes del sistema. 


Demostracion: 

La idea de la demostracion consiste en construir un conjunto de soluciones 
independientes que genere a todas las demas; de este modo, el conjunto de 
soluciones sera un subespacio vectorial. 

Por simplicidad en la notation supondremos que un menor de orden r distinto 
de cero esta formado por las primeras r filas y las primeras r columnas. Es decir, 


an 

a r i 





(4.7) 


Como ya vimos en el Teorema 4.1, las restantes filas son combination lineal de 
las r primeras, es decir, el sistema 


anXi aij'Xj' * * * -|— aifiXyi — 0 


a r \Xi -f- • • • 4- a rr x r 4~ * * * 4~ a rn x n — 0 J 

tiene las mismas soluciones que el sistema original. Entonces, pasando las 
incognitas x r+ i ,..., x n al segundo miembro, 

anaq -j- * • ■ 4- aifXf — ai ^-\-iXr-\-i * * * ai^x^i | 

; ; . \ ( 4 . 8 ) 


a r \Xx + • • • + CL rr X' t 


^r,r+l^r+l ’ ‘ ‘ ®rn^n 
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este sistema es un sistema de Cramer cuya matriz de los coeficientes coincide 
con el menor basico dado en (4.7). 

Denotemos por B a la matriz que corresponde a este menor, y consideremos 
los n — r vectores de R r siguientes 


b r+ i — 


«l,r+l 


v &r,r+l 



Es facil comprobar que el sistema (4.8) se puede escribir como 


B 



o lo que es lo misrno, 


t>r+l£r+l ' ' ' t) n X n 



= — B 1 b r+ ia; r _|_i — • • • — B 1 b n x 


-H 


(4.9) 


(recordemos que existe la inversa de B gracias a (4.7)). 
Consideremos ahora el vector de R n 



( -B~ l ■ b r+1 ^ 

} 


1 


Si = 

0 

1 


l o J 

1 


* r filas 


i — r filas 


es decir, hemos resuelto (4.9) para ay+i = 1, x r +2 = 
analogamente los vectores 

(-B- 1 ■ b r+J \ 


= x n = 0, y 


-Fila r + j 


V o y 
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para j = 2 ,..., n — r, obtenidos al resolver (4.9) para x r +i = • • • = x r +j -1 = 
^7’+.7 + 1 = ■ ■ ■ = % n ~ 0 y X r -\-j = 1- 
Entonces, 

(i) Es evidente por construccion que los vectores S!,..., s n _ r son solucion del 
sistema original. 

(n) {si,... ,s n _ r } es l.i. 

Para ver esto basta observar la matriz obtenida poniendo dichos vectores 
por filas. Las n — r ultimas filas de esta matriz corresponden exactamente 
a / n _ r , luego ahi tenemos un rnenor de orden n — r distinto de cero. 

(ill) {si,..., s n _ r } es un sistema generador de las soluciones del sistema origi¬ 
nal. 

Para probar esto consideremos una solucion del sistema, p = (pi ,... ,p n ). 
La construccion anterior nos lleva a que p satisface 


Pi 


B 


— br+lPr+l ' ' ' b n Pn 


Pr 


pero teniendo en cuenta como son las soluciones S!,...,s n _ r es facil 
comprobar que 

P = Pr+l^l 4“ ’ 1 1 4“ Pn&n—r 

es decir, cualquier solucion del sistema es combination lineal de los vectores 

Si, . . . , S n — r . 

Esto demuestra que {s 1; ..., s n _ r } es una base de las soluciones del sistema 
homogeneo dado, y de aqui se sigue el resultado. 



Como consecuencia de este resultado, las soluciones de un sistema lineal 
homogeneo conforman un subespacio vectorial de dimension n— rango(ti), siendo 
n el numero de incognitas y A la matriz de los coeficientes. Observese que 
la dimension del subespacio coincide con el numero de grados de libertad del 
sistema (numero de incognitas menos numero de ecuaciones relevantes). 
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Encontrar una base del conjunto de soluciones del sistema homogeneo: 

X 2 + x 3 + £4 + x 5 = 0 

x\ — X 2 = 0 

> 

x\ + x 3 + X 4 + x 5 = 0 

Xl + x 2 + x 3 + x 4 + x 5 = 0 , 

En primer lugar estudiamos el rango de la matriz asociada a fin de conocer la 
dimension del subespacio generado por las soluciones. 

/o 1111 

A = ( 1 _1 ° ° ° 

1 0 111 

\1 1111 



Observese que las columnas tercera, cuarta y quinta son iguales, por lo que 
las dos ultimas no influyen en el rango. De manera que el rango no puede ser 
superior a tres. Un simple calculo demuestra que el determinante 


0 

1 

1 


1 

-1 

1 


1 

0 

1 


^0 


de lo que deducimos que rango(A) = 3. La dimension del espacio generado sera 
por tanto 5 — 3 = 2. Para encontrar una base de las soluciones, pasamos al 
segundo miembro las incognitas correspondientes a las columnas que no forrnan 
parte del menor basico encontrado (al igual que en (4.8)); en este caso X 4 y 
£ 5 , y eliminamos las ecuaciones que no forrnan parte del menor basico, por ser 
redundantes. Esto es, 


X2 + £3 = -X4 - x 5 

X\ — X2 = 0 


X\ + X 2 + x 3 


—X4 — £5 


Ahora resolvemos el sistema usando la tecnica empleada en la demostracion del 
teorema anterior. Es decir, para 


X4 = 1, £5 = 0 


X2 + x 3 
Xl — x 2 
Xi-\-X2 + x 3 


-1 

0 

-1 


x\ = 0 
£2 = 0 
*3 = -1 
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luego la solution es (0, 0, — 1,1,0), y para 



x 2 +x 3 = 

- 1 ] 

0 

II 

H 

X4 = 0, x$ = 1 — 

■* Xi — x 2 = 

0 

a- 

H 

IO 

II 

O 


x\ + a: 2 +2:3 = 

-‘J 

x 3 = • 1 


la solution es (0,0, —1, 0,1). Por tanto, las soluciones de este sistema coinciden 
con el subespacio de dimension 2: 

L = L{(0, 0,-1,1,0), (0,0,-1,0,1)) 



En R 3 consideramos el sistema 


X1+X2 = 0 I 

X2 = 0 J 

Obtener una base del subespacio formado por sus soluciones. ^Pertenece el 
vector (—1,1,0) a dicho subespacio? 

En este ejemplo es esencial prestar atencion al espacio en el que se encuentran 
las soluciones del sistema, y que viene resaltado en el enunciado: R 3 . De no 
haber sido especificado, habriamos supuesto, de forma natural, que el espacio 
corresponderia a R 2 , pues vemos solo dos incognitas en el sistema. Al tratarse 
de un sistema en R 3 , hemos de considerar tres incognitas (a pesar de que no las 
veamos). La matriz del sistema es por tanto 

A-(' 1 

V° 1 0/ 

cuyo rango es dos, y de donde deducimos que la dimension del espacio de 
soluciones es 3 — 2 = 1. Para obtener una base hemos de resolver el sistema 
usando un parametro al que daremos un unico valor (igual a 1). Al igual que 
hemos hecho en el ejemplo anterior, los parametros deben ser las incognitas 
correspondientes a las columnas de la matriz que no forman parte del menor 
que proporciona el rango de la misma, es decir, en este caso, x 3 : 

X\ + X 2 = 0 I X\ = 0 

x 3 = l —> > => 

x 2 = 0 J x 2 = 0 
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es decir, una base de soluciones esta formada por el vector (0, 0,1). 

En cuanto a la pertenencia del vector (—1,1,0), la forma mas sencilla de 
comprobarlo consiste en ver si el vector (—1,1,0) verifica las ecuaciones que 
definen el subespacio, esto es, X\ + x<i = 0, lo cual se cumple, y xi = 0, que no 
se cumple. Puesto que no verifica todas las ecuaciones, este vector no esta en el 
subespacio. 

Tambien podrfamos haber razonado comprobando que el vector (—1,1, 0) es 
independiente con la base que hemos obtenido, de modo que no esta en dicho 
subespacio. 



Recfprocamente, todo subespacio vectorial de K” de dimension k puede 
determinarse a traves de las soluciones de un sistema lineal homogeneo. 


Demostracion: 

Sea L = L(wi,... ,Wfc), con {wi,...,Wfc} un conjunto l.i. donde denotamos 
por Wj = (an,a in ), 1 <i <k. 

Consideremos ahora x es un vector de L de coordenadas (aq,..., x n ). La 
pertenencia de x al subespacio L significa que x es combination lineal de los 
vectores w,, luego 


rango 




Es decir, todos los menores de orden k + 1 de la ultima matriz tienen que ser 
necesariamente nulos. Asf pues, bastara orlar un rnenor basico distinto de cero 
(que por comodidad suponemos que se tiene en las k primeras columnas) con la 
fila k + 1 y las restantes columnas, o sea, 


Oil 

• Olfc 


Ofcl • 

O kk 

^k,k -\-1 

Xx • 

■ Xk 

1 


Oil 

• Olfc 

Q-l,fc+2 

Ofcl • 

O’kk 

O j k,k+‘2 

Xi • 

■ x k 

%k +2 
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an 

■ • a-i k 

& In 

afci • 

' ' &kk 

O'kn 

x 1 • 

■ ■ x k 

Xn 


Cada uno de estos determinantes proporciona una ecuacion lineal y por tanto 
se genera de este rnodo un sistema lineal homogeneo de n — fc ecuaciones, cuyas 
soluciones son vectores de L. 


A un sistema de ecuaciones homogeneo cuyas soluciones determinan un 
subespacio se le denomina sistema de ecuaciones implicitas de ese subespacio. 


Consideremos el subespacio L = ((1,1,1), (0,1, 0)) y encontremos una base 
un sistema de ecuaciones implicitas del mismo. 

Dado que 


A i 

rango 

V° * 1 


= 2 


los vectores que generan el subespacio son l.i. y por tanto forman una base. Para 
encontrar un sistema de ecuaciones implicitas debemos pedir que 


( 1 

1 

A 

1 

1 

1 

rango 0 

1 

0 = 2 => 

0 

1 

0 

\Xl 

X-2 

x 3 J 

X\ 

X-2 

x 3 


0 => X 3 — X\ = 0 


Asi pues, el sistema formado por la ecuacion x\ — X 3 = 0 es un sistema de 
ecuaciones implicitas de L. 


Procedamos de forma analoga con el subespacio L = L{ wi,W 2 ,W 3 ), donde 
wi = (1,1,1,1), w 2 = (-3,2,0,1), w 3 = (-2,3,1,2) 

Sabemos que 

1 1 1 1 

dim L = rango | 3 2 0 1 ) = 2 con rango 

-2312 


1 1 
0 1 


7^0 
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luego una base de L vendra dada por los vectores wi y W 2 . Para encontrar un 
sistema de ecuaciones implicitas procedemos corno en el caso anterior: 


rango 


Xi x 2 x 3 X4 


= 2 => 


1 

-3 


X\ X 3 X4 


X 2 X 3 X4 


= 0 , 


= 0 


de donde se obtiene el sistema de ecuaciones 


x\ — 4x 3 + 3x4 = 0 
X 2 + x 3 — 2 X 4 = 0 


Notese que hay mas menores de orden tres que no hemos considerado, (por 
ejemplo, el formado por las tres ultimas columnas de la matriz) que darfan lugar 
a otra ecuacion distinta. Sin embargo, el metodo del orlado garantiza que esta 
ecuacion resultante es dependiente de las anteriores, y por tanto no es necesario 
considerarla. 



Encontrar la dimension y una base del subespacio 


M = {p(x) G P®[x] : p{ 1) = 0} 

En este ejemplo nos enfrentamos con una forma diferente de definir un 
subespacio vectorial. En lugar de proporcionarnos un sistema de generadores 
(como en el ejemplo 4.12) o un sistema de ecuaciones homogeneo (como en el 
ejemplo 4.13) nos dan una descripcion de los elementos que forman parte del 
conjunto, a partir de la cual hemos de encontrar su dimension y una base. 

Para ello procederemos del siguiente rnodo: escogemos un elemento generico 
del espacio que contiene al conjunto, en este caso P{j[x], para el que usaremos 
las incognitas Xi como coordenadas canonicas, es decir, tomamos 

p(x) = Xi + x 2 ■ x + x 3 ■ x 2 
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y a continuation imponemos sobre este elemento la description que define a los 
elementos de nuestro conjunto. Esto es, 

p(x) £ M => p(l) = 0 => Xi + x 2 + x 3 = 0 

De este rnodo se obtiene un sistema de ecuaciones homogeneo (en este caso 
solo una ecuacion) para el que llevamos a cabo un tratamiento como en el 
ejemplo 4.13. Puesto que el rango de la matriz de este sistema 

A =( 1 1 l) 

es uno y dim(P^[x]) = 3, entonces dim(M) = 3 — 1 = 2 y resolvemos la ecuacion 
con dos parametros: 

X 2 = 1, x 3 = 0 —» X\ = -1 
x 2 = 0, x 3 = 1 —> x\ = —1 

luego las soluciones son (—1,1,0) y (—1,0,1). Notese que estas soluciones 
corresponden a las coordenadas respecto de la base canonica de P|[x], por lo 
tanto, una base de M esta formada por {—1 + x, — 1 + x 2 }. 


DBH Operaciones con subespacios 

En lo que resta de terna vamos a trabajar con mas de un subespacio vectorial 
del mismo e.v. Comenzamos viendo una propiedad interesante de los subespacios 
vectoriales. 



Sean L i y L 2 dos subespacios vectoriales de V. Si L\ C L 2 y dim(Li) = 
dim(L 2 ) entonces L\ = L 2 . 


Demostracion: 

Puesto que L\ C L 2l solo hay que probar la inclusion contraria. 7 Sea x £ L 2 , 
y B una base de L\ formada por dim(Li) = k vectores. Como L\ C L 2 , el 
conjunto B es l.i. en L 2 . Como ademas L 2 tambien tiene dimension igual a k , B 
es un conjunto de k vectores l.i. en un espacio de dimension k, es decir es una 
base de L 2 (vease el Corolario 4.5). 

7 Cuando queremos probar que dos conjuntos Ay B son iguales, se suele proceder probando 
la doble inclusion, es decir A C B y B C A (vease el apendice A). 
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A1 ser base de L 2 , x se escribe como combination lineal de B , que a su vez 
esta tambien en L\, por tanto x £ L\. De la arbitrariedad de x se sigue la 
igualdad entre los espacios. 

■ 

Notese que la clave en la demostracion anterior esta en probar que la base 
de L\ tambien lo es de £ 2 - En definitiva, si un conjunto es base de dos espacios, 
entonces ambos espacios son iguales (de hecho basta con que sea sistema 
generador). 



Dados dos subespacios L\, L 2 de un e.v. V se define la suma de L\ y L 2 por 


L\ + L2 — {ui + U2 : Ui £ Li, U2 £ L2} 
Igualmente definimos la intersection de L\ y L 2 por 

Li n L 2 = {u : u £ Li, u £ L 2 } 


— ^ - 

Si L\ y L 2 son subespacios vectoriales, entonces L\ -fi L 2 y L\ D L 2 tambien 
son subespacios vectoriales. 


Demostracion: 

Usaremos la Proposition 4.9. Si u y v £ L\ + L 2 entonces 

u = Ui + u 2 , con Ui £ Li, u 2 £ L 2 
v = V! + v 2 , con V! £ L 1: v 2 £ L 2 

Entonces, 

au + /3v = a(ui + u 2 ) + /3(vi + v 2 ) = (aui + /3v 1 ) + (au 2 + /3v 2 ) 


con 


(aui + /3vi) £ L 1 y (au 2 + /3v 2 ) £ L 2 
La prueba para la interseccion es identica y se deja al lector. 


El siguiente resultado nos dice como obtener la suma y la interseccion de 
subespacios a partir de las bases o los sistemas de ecuaciones imph'citas. 
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— ^ - 

Sean Li y L 2 dos subespacios de un e.v. V. Se verifica: 

(i) Si B\ es una base de L\ y B 2 es una base de L 2 , entonces L\ + L 2 = 
L(B\ U B 2 ), esto es, B\ U B 2 es un sistema generador de L\ + L 2 . 

(n) Si Ax = 0 es un sistema de ecuaciones implicitas de L\ y Bx = 0 es un 
sistema de ecuaciones implicitas de L 2 , entonces, 

Ax = 0 
Bx = 0 

es un sistema de ecuaciones implicitas de Li C\L 2 . 


La demostracion se deja como ejercicio para el lector (ejercicio 28). 


Teorema 4.12 (Formula de la dimension) 


Si L\ y L 2 son subespacios de un e.v. V se verifica: 

dim(L!) + dim(L 2 ) = dim(L 1 + L 2 ) + dim(L! (~l L 2 ) 


Demostracion: 

Sea {ei,... ,e;} una base de LiP\L 2 . Como LiC\L 2 C Li, L 2 podemos encontrar 
vectores fi,... f fc , gi,... g m , tales que 

{ei,...,e/,fi,...,f fc } es base de L x 
{ei, - - - ,e;,gi,... ,g m } es base de L 2 

Esta claro que si probamos que el conjunto 

B {ei, •.., e;, fi,..., ffc, gi,..., gm} 

es una base de L i + L 2 habremos terminado la prueba. 

Es evidente, usando (i) del Teorema 4.11, que S es un sistema generador 
de L\ + L 2 . Veamos que tambien es l.i. Consideremos una combinacion lineal 
igualada al vector nulo: 


oqe i + • • • + aiei + /3ifi + • • • + (3k$k + 7iSi + ■ ■ ■ + 7mS™ — 0 (4-10) 
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Denotemos por v = aqei + ■ • • + cqe; + pii\ H - b PA- Esta claro que v £ L i. 

Por otra parte, podemos escribir 

v = -7l gl-7m gm 

luego v £ L 2 . De modo que v £ Li flL 2 . Como las coordenadas respecto de una 
base son unicas, 

/?i = • • • = /3 k = 7i = '' • 7m = 0 (4-11) 

Finalmente, como e 1( ... ,e; forman una base, de (4.10) y (4.11) deducimos que 
a\ = ■ • • = ai = 0 . 


Finalizamos la section con el concepto de suma directa de subespacios. 



Un e.v. V es suma directa de dos subespacios L 1 y i 2 si y solo si 


L\ + L 2 — V y L\ n L 2 — {0} 


Se notara V = Li © i 2 . 



Son equivalentes: 
( 1 ) V = Li © i 2 . 


( 11 ) Vv £ V, v = V! + v 2 , con Vi £ Li, v 2 £ L 2 , unicos. 


Demostracion: 

Probemos en primer lugar ( 1 ) => ( 11 ). 

Puesto que V = Li + L 2 , solo es necesario probar la unicidad de la descom- 
posicion. En efecto, supongamos que 


V = Vi + V 2 = Ui + u 2 


Entonces, vj — iq = u 2 — v 2 con Vi — Ui € Li y u 2 — v 2 £ L 2 . Es decir, 
v 1 - Ui, u 2 v 2 £ Li n L 2 = {0} 


De aqui se tiene que Vi = Ui y v 2 = u 2 . 
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Veamos la implication contraria. Esta claro por la definition de suma de 
subespacios (Definition 4.12) que V = Li + L 2 . Por otra parte, si v G L 3 n L 2 
podemos escribir 

v = v + 0 = 0 + v 


Ahora bien, como la descomposicion es unica, solo existe la posibilidad de que 
v = 0; luego Li n L 2 = {0}. 


Considerense los subespacios de 


L\ 


X\ + x 2 + x 3 + £4 = 0 
x 3 + X 4 = 0 


L 2 = <(1,0,0,0), (0,0,0,1), (3,0,0,7)) 

Comprobemos que R 4 = L\ © L 2 . 

Calculemos una base de cada uno de los subespacios dados. Para L± hemos 
de resolver el sistema tal y como vimos en el ejemplo 4.13. La matriz del sistema 
es 

O 1 1 A 
\0 0 1 \) 

cuyo rango es claramente dos, por tanto dirn(Li) = 4 — 2 = 2. Un menor distinto 
de cero esta formado por las columnas dos y tres, lo que nos indica que debemos 
resolver el sistema con los parametros y 14 : 


X 2 -(- X 3 = — Xi - £4 
£3 = -£4 


£i = l, £4 = 0 => £2 = —1, £3 = 0 — ► (1, —1,0,0) 
£i=0, £4 = 1 => £2 = 0, £3 = — 1 —> (0,0, —1,1) 

Luego una base de Li es {(1, —1,0,0), (0,0, —1,1)} 

Por su parte, {(1, 0,0, 0), (0, 0,0,1), (3,0, 0, 7)} es un sistema generador de 
L 2 , y dado que 

/1 0 0 0 

rango I 0 0 0 1 ) = 2 

\ 3 0 0 7 


una base de L 2 es {(1, 0,0,0), (0,0,0,1)}, y por tanto dim(L 2 ) = 2. 
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Calculemos ahora L\ + L 2 . Para ello, simplemente consideramos el conjunto 
formado por la base de L i y la base de L 2 y estudiamos si son o no l.i.: 


rango 



-1 

0 

0 

0 


0 

-1 

0 

0 



= 4 


luego forman base. Asi pues dim(Li + L 2 ) = 4 y dado que estamos en R 4 se 
tiene que L\ + L 2 = R 4 (vease el Teorema 4.9). 

Por ultimo, estudiemos L\ n L 2 . Para identificar este espacio necesitamos 
juntar los sistemas de ecuaciones implicitas de ambos subespacios. Para L\ ya 
lo tenemos, y para L 2 procedemos como en el ejemplo 4.15: 


( 1 

0 

0 

°\ 

1 

0 

0 


1 

0 

0 

rango I 0 

0 

0 

1 I = 2 => 

0 

0 

1 

= 0, 

0 

0 

1 

\CCl 

Xl 

x 3 

X4 J 

Xl 

X 2 

X4 


Xl 

x 3 

X4 


que resulta: 


x 2 = 0, x 3 = 0 


Por tanto, un sistema de ecuaciones implicitas de L\ n L 2 vendra dado por 


L 1 (~l L 2 


Xi+X 2 + X 3 + Xi = ti 
X 3 +X4 = 0 

x 2 = 0 
X 3 = 0 


Si miramos el rango de la matriz de coeficientes del sistema observamos que es 
4, por tanto dim(Li n L 2 ) = 0, y eso significa que L\ n L 2 = {0}. 

En realidad si hubieramos usado la formula de la dimension (Teorema 4.12) 
podriamos haber llegado a esta conclusion mucho antes, pues sabiendo que 
dim(Li) = 2, dim(L 2 ) = 2 y que dim(Li + L 2 ) = 4 deducimos de inmediato 
que dim(Li fl L 2 ) tiene que ser 0, y por tanto es el espacio nulo. Dado que se 
cumplen las condiciones de la Definition 4.13 se tiene que R. 4 = Li (B L 2 . 


Finalmente, veamos como el concepto de suma e intersection entre dos 
subespacios se puede generalizar a mas subespacios. 
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Dados Li, ..., L n subespacios de un e.v. V, se definen 

n ( n \ 

^v,:v l 6 L t 

2 = 1 U= 1 ) 

n 

n Li = {v e V : v € Li, Vi} 


2=1 


En este caso la suma directa de n subespacios viene dada por 


^ = 0L i ^y = ^4 i<n ( ={°}> < = 


2=1 


2=1 


k^i 


mm - 

CALCULO CON PYTHON 


Como el lector habra podido comprobar, los calculos necesarios para este 
tema se reducen basicamente a resolver sistemas homogeneos y calcular rangos, 
lo cual ya se ha hecho en los temas anteriores. No obstante, si bien antes 
trabajamos directamente con matrices, en este tema es mas frecuente trabajar 
con vectores, que aunque pueden ser considerados como matrices fila o colunma, 
se perciben mas como arreglos. Asi pues, en esta section insistiremos un poco 
mas en el manejo de estos elementos. 


1 

2 

3 

4 

5 

6 

7 

8 
9 

10 

11 

12 

13 

14 

15 

16 
17 


>>> from numpy import array,dot 
>>> a=array(range(6)) 

>>> a 

array ( [0, 1, 2, 3, 4, 5]) 

>>> len(a) 

6 

>>> a.shape 
(6,) 

>>> b=a.reshape(2,3) 

>>> b 

array ( [ [0, 1, 2] , 

[3, 4, 5]]) 

>>> b.shape 
(2, 3) 

>>> c = a.reshape(6,1) 

>>> c 

array( [ [0] , 











180 


Tema 4 ■ Espacios vectoriales 


[1] , 

[2] , 

[3] , 

[4] , 

[5] ] ) 

>>> b . T 
array([[0, 3] , 

[1 , 4] , 

[2, 5]]) 

>>> b*b.T 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

ValueError: shape mismatch: objects cannot be broadcast to a 
single shape 
>>> b*b 

array ( [ [ 0, 1, 4] , 

[9, 16, 25]]) 

>>> dot(b,b.T) 
array([[ 5, 14], 

[14, 50]]) 

>>> dot(b.T,b) 
array([[ 9, 12, 15], 

[12, 17, 22], 

[15, 22, 29]]) 

>>> dot(a , c) 
array([55]) 

>>> dot(c,a) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

ValueError: objects are not aligned 
>>> c.shape 
(6, 1) 

Vemos en la columna izquierda como podemos construir arreglos, bien di- 
rectamente, bien disponiendo sus elementos en un orden distinto con el modulo 
reshape. Lo mas notable de la diferencia entre el uso de arreglos y matrices es 
que el operador de multiplication * no corresponde a la multiplication matricial 
de arreglos bidimensionales, de ahf el error que aparece en la linea 28. Si obser- 
vamos la linea 31, vemos que la multiplication entre arreglos se realiza elemento 
a elemento, y que la multiplication matricial se hace con la funcion dot. 

Por otra parte, hay que tener cuidado pues no es lo mismo un arreglo 
unidimensional, que un arreglo bidimensional que tenga una de sus dimensiones 
igual a uno, como se aprecia en la linea 44. El producto matricial de c por a 
no se puede hacer pues c es un arreglo bidimensional de orden 6x1, pero a es 
unidimensional (linea 8). 

Sin embargo, cuando se trata de multiplicar por un vector, es decir, por un 
arreglo unidimensional, la funcion dot permite cierta flexibilidad: 


18 

19 

20 
21 
22 

23 

24 

25 

26 

27 

28 

29 

30 

31 

32 

33 

34 

35 

36 

37 

38 

39 

40 

41 

42 

43 

44 

45 

46 

47 

48 
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49 

50 

51 

52 

53 

54 

55 

56 

57 

58 


>>> d=array((2,3,5) 
>>> e=arrayC(5,9)) 
>>> f=d.reshape(3,1) 
>>> dot (b ,d) 
array ( [13 , 43] ) 

>>> dot (b , f) 
array([[13] , 

[43]]) 

>>> dot(e , b) 
array( [27 , 41 , 55]) 


Para terminar, si bien comentamos anteriormente que no hay forma directa 
de calcular el rango de una matriz, dimos una forma sencilla de obtenerlo 
indirectamente con SymPy, y tambien se puede lograr con NumPy, usando una 
funcion de linalg que veremos con mas detenimiento en un tema posterior. 

1 >>> from numpy import array,linalg 

2 >>> a=array 

([[2,3,1,-4,2] , [1,2,1,-2,3] , [2,3,0,2,1] , [1,2,0,2 , 1]]) 

3 >>> linalg.lstsq(a,a) [ 2 ] 

4 4 


La funcion usada es linalg.lstsq, y la llamada puede parecer un poco 
extraha, pues precisa de dos argumentos, el primero de los cuales es el arre- 
glo bidimensional cuyo rango queremos calcular, y el segundo no necesitamos 
explicarlo aqui (se vera posteriormente en el tema 8); simplemente volvemos a 
usar el mismo argumento. Esta funcion proporciona cuatro resultados a traves 
de un arreglo (de forma similar al uso del modulo LUdecomposition en la sec- 
cion 3.4), de los cuales el tercero (indice 2) es precisamente el rango de la matriz 
introducida. 


Dado que Python es un lenguaje modular construido a partir de funciones, 
podemos aprovecharnos de ello para definir nuestra propia funcion rango que 
podamos usar en cualquier momento, del mismo modo que tenemos a nuestra 
disposition el modulo NumPy. La forma de proceder es la misma que hicimos 
para ejecutar el codigo de la funcion jacobi al final de la section 3.4. 

Creamos un archivo con el contenido de la funcion. 


1 from numpy import linalg 

2 

3 def rango(a): 

4 x = linalg.lstsq (a , a) [ 2 ] 

5 return x 


y lo guardamos con el nombre mimodulo.py. Lo mas efectivo es guardar este 
fichero en alguna de las carpetas en las que el interprete Python busca a la 
hora de importar un modulo. Estas carpetas son las defmidas en la variable de 
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Figura 4.1: Asf se juega a Lights Out! 


entorno PYTHONPATH que se puede obtener mediante la funcion path del modulo 
sys, y logicamente depende del sistema operativo que se este usando. La otra 
option es guardar el archivo en la carpeta desde la que ejecutamos el interprete. 
Una vez guardado, se procederfa asf, 

1 >>> from numpy import array 

2 >>> a=array ( [ [1 ,0,1,0] , [2,1,3,1] , [0,1 ,1 , 1] , [2,2,4,2]]) 

3 >>> from mimodulo import rango 

4 >>> rango(a) 

5 2 


□ II - 

APLICACION: LIGHTS OUT!, PRIMERA PARTE 

Vamos a dedicar esta section al estudio algebraico de un juego electronico 
denominado Lights Out!, que podrfa traducirse por jApaga las luces!, y que 
consiste en un tablero que consta de 5 x 5 casillas (o bombillas), cada una de 
las cuales puede estar apagada o encendida. Al pulsar sobre cualquier casilla, 
esta cambia de estado, conjuntamente con las casillas adyacentes de su lfnea 
horizontal y vertical. El juego consiste en, dada una configuration inicial, ir 
pulsando las casillas necesarias hasta conseguir apagar todas ellas. La figura 4.1 
























































4.7 ■ Aplicacion: Lights Out!, primera parte 


183 


muestra un par de ejemplos del funcionamiento del juego. 

Hemos de tener en cuenta dos observaciones importantes de la dinamica de 
este juego: en primer lugar, al pulsar dos veces sobre la misma casilla el tablero 
permanece en el mismo estado inicial; y en segundo lugar, es facil darse cuenta 
de que el orden en el que se pulsen las casillas no afecta al estado obtenido. 

Para analizar matematicamente el funcionamiento del juego hemos de situar- 
nos en el contexto adecuado, que en este caso corresponde a un e.v. peculiar: 
Z| 5 . 

Recordemos que en la definicion de e.v. es preciso que exista un cuerpo 
con el que realizar la operacion producto por escalar. Hasta ahora, los cuerpos 
conocidos por el lector son Q, 1 y C, pero aquf vamos a necesitar un nuevo 
conjunto que tiene esta estructura: Z 2 , definido como el conjunto de numeros 
enteros modulo 2. 

En general Z p , el conjunto de numeros enteros modulo p , donde p € Z, esta 
formado por todos los numeros enteros en los que se da una cierta relacion de 
equivalencia: diremos que ay b son equivalentes si el resto de la division de 
ambos entre p es el mismo. Se notara por a = b (mod p). Por ejemplo 25 = 35 
(mod 10), 6 3 = 1 (mod 2). Es decir, Z p es el conjunto cociente definido por 
esta relacion de equivalencia (vease el Apendice A). 

A partir de aquf es facil observar que Z p = {0,1,2,... ,p — 1}, es decir, 
es un conjunto finito. Si ademas p es un numero primo, la operacion suma y 
producto habituales en Z dotan a Z p de estructura de cuerpo. Por ejemplo, si 
consideramos Z 2 = {0,1}, entonces la operacion suma en este conjunto es 

0 + 0 = 0, 0 + 1 = 1, 1 + 0 = 1, 1 + 1 = 0 (4.12) 


El lector quizas se pregunte por que 1 +1 = 0. La respuesta es sencilla, 1 + 1 = 2, 
pero 2 = 0 (mod 2), pues el resto de la division de 2 entre 2 es 0; asf funciona 
lo que se denomina como aritmetica modular. La operacion suma definida en 
(4.12) junto con la operacion producto de enteros en este espacio Z 2 satisfacen 
las propiedades adecuadas para que Z 2 sea un cuerpo. 

Si ahora consideramos Z^, el producto cartesiano de Z 2 consigo mismo, n 
veces, y lo dotamos de la suma y el producto escalar habituales, en el que 
el cuerpo de escalares corresponde a Z 2 , entonces tenemos una estructura de 
espacio vectorial. Este e.v. tiene la peculiaridad de constar solo de un numero 
finito de elementos (en concreto 2 n ). 

Volvamos al juego: el estado de encendido o apagado de cada una de las 
casillas del tablero se puede modelar en Z 2 , asignando un 0 a la casilla apagada 
y un 1 a la casilla encendida. Asf, la suma descrita en (4.12) corresponde al 
cambio de estado de una casilla. Como tenemos 25 casillas, vamos a establecer 
el estado de todo el tablero como un vector de Z| 5 , en el que consideraremos la 
numeration dada en la figura 4.2. 

Asf, por ejemplo, el vector que describe el ultimo tablero de la figura 4.1 es 


( 1 , 1 , 0 , 0 , 0 , 1 , 1 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 1 , 0 , 0 , 0 , 1 , 0 , 0 , 0 , 0 , 0 , 0 ) 
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1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

21 

22 

23 

24 

25 


Figura 4.2: Numeration de las casillas 


De este modo, un vector cualquiera de Z| 5 correspondera a una configura¬ 
tion determinada de luces encendidas y apagadas del tablero. El objetivo del 
juego consistira entonces en, dada una configuration initial, encontrar que com¬ 
bination de pulsaciones nos lleva a la configuration nula. 

Ahora bien, atendiendo a las observaciones que hicimos antes, si tenemos 
una configuration initial b obtenida al presionar una serie de casillas en el 
tablero inicialmente apagado, volviendo a presionar nuevamente esas casillas 
conseguiremos apagar todo el tablero. Esta sucesion de pulsaciones, lo que se 
denomina una estrategia, puede ser representada tambien por otro vector de 

X = (X!,X 2 , ■ ■ .,X 2 4:,X25) 

en el que Xi sera 1 si se ha pulsado la casilla * y 0 si no se ha pulsado. Entonces, 
dado b G Z| 5 , la estrategia ganadora verifica: 


bi = X\ + x 2 + x 6 

b 2 = x 3 + x 2 + x 3 + X’j 

b 3 = x 2 + x 3 + X 4 + x s 


b 24 = x w + X 23 + X24 + X25 
b 2 5 = x 2 0 + X 2 4 + X25 

Es facil reescribir el sistema anterior en forma matricial, Ax = b, donde la 
matriz A € M. 25 (^ 2 ) tiene la siguiente estructura de bloques 


A = 


^ B 
I 

0 

0 

V° 


I 

B 

I 

0 

0 


0 

I 

B 

I 

0 


0 

0 

I 

B 

I 


0^ 

0 

0 

I 

B ) 


(4.13) 
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donde 0 denota la matriz nula de tamano 5 x 5, / es la matriz identidad de 
tamano 5 x 5 y B es 


/l 1 0 0 o\ 
1110 0 


5=01110 


0 0 111 
^0 0 0 1 ly 


Atendiendo al significado del producto de matrices, podemos observar que 
Ax corresponde a una combination lineal de los vectores que conforman las 
columnas de la matriz A , y en la que los escalares son los elementos del vector 
x. Asi pues, b es una configuration alcanzable si dicho vector es combination 
lineal de los vectores columna de A. En la section 8.5 volveremos sobre este 
juego para averiguar la forma de saber si una configuration inicial puede ser 
apagada o no de una forma mas rapida. 


urn 


EJERCICIOS 


Ejercicios de repaso 

|31 Determinar si los siguientes conjuntos de vectores son linealmente de- 
pendientes o independientes. En caso de que sean linealmente dependientes en- 
contrar una combination lineal no nula entre ellos que proporcione el vector 
nulo: 


(a) {(3,5,1), (2,1,3)} (b) {(1,2,3), (1,3,2), (0, -1,1)} 

(c){(l, 0,1,0), (2,1,3,1), (0,1,1,1), (2, 2,4, 2)} 


1*1 En cada uno de los apartados del ejercicio 1 calcular el rango del conjunto 
de vectores dado. 

|3| Estudiar si las siguientes familias de vectores son o no l.i.: 



(b) {x — 1, X + 1, X 2 — 1} C Pr[cc]. 

(c) {sen 2 (7ra:), cos 2 (7rx), cos(27ra;)} cC([0,l]). 


131 Estudiar si los siguientes conjuntos son bases del espacio vectorial dado: 


(a) {l, x + 3, (x + 3) 2 , (x + 3) 3 } en Pj|[a;]. 
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(b) 





en A^R). 


(c) 





en A42(R)- 


133 En R 3 se consideran los siguientes conjuntos: 


A = {(1,5,1), (2,1,0)} 

(7 = {(1,5,1), (2,1,0), (1,0,0), (0,0,1)} 


Se pide: 

(a) Probar que A es l.i. y que C es un sistema generador de R 3 . 

(b) Encontrar una base B que contenga a A y este contenida en C. 

133 Demostrar que el conjunto S = {a; + 1, x — 1, x 2 — 1, x 2 + 1} es un 
sistema generador de Pj|[:e]. Encontrar un subconjunto Si de S que sea una 
base de P^[x]. 

|3| Sea B la base canonica de R 3 y consideremos el conjunto 
B' = {(1,1,1), (0,1,1), (0,0,1)} 

(a) Demostrar que B' es una base de R 3 . 

(b) Hallar las coordenadas del vector u = (3, —2, 5) respecto de la base B'. 

(c) Hallar las ecuaciones del cambio de base de 6 a 6'. 

I3t:i Verificar si los siguientes conjuntos son subespacios vectoriales: 

(a) {(*i,..., x n ) £ R" : x\ H-b x n = 0}. 

(b) {(ii,...,j;„)eR":iH-b x n = 1}. 

(c) {p(x) G PkI 3 -] : (x — 1) divide a p{x)}. 

(d) COM(H) = jn G A1 2 (R) : AB = BA donde B = 

131 En R 3 consideramos el subespacio generado por los vectores (2, 3, 0) y 
(4,6,1). ^Pertenece el vector (1,0,0) a este subespacio? 

1313 En R 3 consideramos los siguientes conjuntos: 



A = {(1,1,1), (0,1,0)} y B = {(2,3,2), (1,0,1)}. 
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iEs L(A) = L(B )? 

[31] En K 4 determinar la dimension y una base del subespacio vectorial 
formado por las soluciones de los siguientes sistemas: 


(a) 


XI + X 2 — X3 — X4 = 0 
x\ — X2 + 2.X3 — X4 = 0 


(b) 


x\ + X2 + 2x3 — £4 = 0 
Xi + X2 + 3^3 + 2x4 = 0 


3xi + X 2 + 4 x 3 — 2 x 4 = 0 
X4 2X2 3x3 p X4 = 0 

2xi — X2 + X3 — 3 x 4 = 0 
xi + x 2 + 2 x 3 = 0 


|3£] Sea V un espacio vectorial real de dimension 5. Para cada uno de los 
subespacios siguientes calcular un sistema de ecuaciones imph'citas: 

(a) Li = L((1,0,1,-1,1), (1,1,1,0,0)). 

(b) L 2 = L(( 0,1,2,1,0), (1,1, -1, -2,1), (3, -1, —7, -8,3)). 

Problemas 

BB En un espacio vectorial V se tiene una base B = {ui, u 2 , u 3 } y un vector 
x cuyas coordenadas con respecto a B son (1, —1, 2). Demostrar que el conjunto 


S — {ui + U 2 , Ui + U 2 + 113 } 


es l.i. y completar S a una base B' tal que las coordenadas de x con respecto a 
B' sean (1,1,1). 

BE] Sabiendo que un vector v G K 2 tiene coordenadas (1, a) en la base 
B\ = {(1, 2), (4, — 1)} y (6,/3) en la base B 2 = {(1,1), (1, —1)}, determinar las 
coordenadas de v en la base canonica. 

BS EnP| [x] consideremos el polinomio p(x) = ax 3 + bx 2 +cx + d con o / 0). 

(a) Demostrar que el conjunto B = {p(x),p'(x),p"(x),p'"(x)} es una base de 
Pg [x]. 

(b) Si p(x) = 5x 3 + 3x 2 — 2x + 1, hallar las ecuaciones del cambio de base 
de B a la base canonica de Pj|[x], y las coordenadas del vector q(x) = 
15x 3 — 21x 2 — 18x + 37 en ambas bases. 

I ana Consideremos los conjuntos de K 3 

Bi = {(1,1,1), (0,1,1), (0,0,1)}, B 2 = {(0,1,0), (1,1, -1), (-2,0,1)} 


(a) Probar que ambos conjuntos son bases de R 3 . 
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(b) Determinar el conjunto de vectores de R 3 que poseen las mismas coorde- 
nadas respecto de ambas bases. 

* ia»i Consideremos {ei, e 2 ,..., e n } la base canonica de R" y los vectores 

Ul — ©2 U.2 — 63 G2, • • • 1 U-n —1 — 15 — G n 

(a) Demostrar que los Uj forman base en R". 

(b) Encontrar las coordenadas del vector x = e * con respecto a la base 

formada por los . 

Wta ^Para que valores de a y /3 el conjunto W = {p{x) G P-|[a:] : p(0) = 
a, p'( 0) = /?} es un subespacio vectorial? Para los valores obtenidos obtener 
una base y la dimension de dicho subespacio. 

|2£| Determinar la dimension del subespacio vectorial formado por las solu- 
ciones de los siguientes sistemas, en funcion del parametro ra£l: 



lawn Calcular la dimension y una base de los siguientes espacios: 
(a) W = {p(x) e P|[x] : p(0) = 0, p{ 2) = 0}. 


(b) El subconjunto de A^ 2 x 3 (®) tales que la suma de los elementos de cada 
colunma suman cero. 

HW1 En R 4 se consideran los pares de subespacios que siguen. Hallar la 
dimension y una base de L i, L 2 , L\ + L 2 y L\ D L 2 . ^En que casos se tiene que 
R 4 = L\ ® L 2 ? 



(b) L x = L(( 1, -1, 2,1), (0,1, -1, 3), (2, 0,1, -1)); 


L 2 = l 

I x\ — 2 x 2 + 60:3 — 60:4 = 0 


2 xi — x 2 — 3x3 = 0 
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lawa Hallar la suma y la intersection de cada uno de los siguientes pares de 
subespacios. Estudiar, cuando proceda, su suma directa: 



Nota: el espacio COM(A) se definio en el ejercicio 8, mientras que tr(A) 
denota la traza de un rnatriz, definida como la suma de sus elementos 
diagonales. 

(b) Vi es el conjunto de matrices simetricas en .M 2 (R), 

V 2 es el conjunto de matrices antisimetricas en _Ad 2 (R). 

(c) V\ = {p(x) £ Pj|[a;] : {x — 1) divide a p(x)}, 

V 2 = jp(a:) £ Pj|[a;] : (x + 1) divide a p(x)}. 

*(d) V\ es el conjunto de funciones / : R —>■ R pares en C(R), 

V 2 es el conjunto de funciones / : R —> R impares en C(R) 

Nota: C(R) denota el conjunto de funciones continuas en R. 

HWtl Sean L\ y L 2 dos subespacios vectoriales de un e.v. V tal que dim(E) = 5 
y dim(Li) = dim(L 2 ) = 3. ^En cuales de las siguientes situaciones se cumple 
que para todo vector u £ V, existen vectores wi £ y w 2 £ L 2 tales que 
u = Wi + w 2 ? 

(a) Siempre, aunque los vectores Wi y w 2 pueden ser no unicos. 

(b) Cuando dim(Li fl L 2 ) = 1. 

(c) Cuando dim(Li fl L 2 ) = 2. 

(d) Cuando V = L\ + L 2 , en cuyo caso los vectores Wi y w 2 son unicos. 

Ejercicios teoricos 

12££] Definimos en R 2 las operaciones suma y producto por un escalar real 

del siguiente rnodo: 

(x 1 ,x 2 ) + ( 2 / 1 , y 2 ) = (aq +vi,x 2 + y 2 ), a (aq, a: 2 ) = (a 2 aq, a 2 a; 2 ), a £ R 

Estudiar si, con estas operaciones, R 2 es un espacio vectorial. 

*12^3 Probar que C 2 es un espacio vectorial real y calcula su dimension. ^Es 
diferente si se considera C 2 como e.v. complejo? 

*12221 Sean los polinomios pi{x), p 2 (ir), .. ., pk{x) y supongamos que 


Pi{a\) P2(ai) ••• Pk(ai) 
Pi(a 2 ) p 2 (a 2 ) ••• p k {a 2 ) 


^0 


Pi(a k ) p 2 (a k ) ■■■ Pk(a k ) 
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para ciertos numeros reales aj distintos entre si. Demostrar que el conjunto de 
polinomios dado es linealmente independiente en Pu[ir]. 

I3WI Sea A G A4 n (IK) una matriz no singular y {vi,...v n } un conjun¬ 
to de vectores de K n linealmente independientes. Probar que el conjunto 
{Avi,... Av n } es linealmente independiente. ^Es cierto el resultado si A es 
singular? 

I3£j Probar el Teorema 4.11. 

HB!1 Sea V un espacio vectorial. Probar que si la dimension de la suma de 
dos subespacios de V es una unidad mayor que la dimension de su intersection 
entonces la suma coincide con uno de ellos y la intersection con el otro. 

1*111 Si L i y L 2 son subespacios de un e.v. V tales que V = L\ ® L 2 , probar 
que si y B 2 son bases de Li y L 2 , respectivamente, entonces B\ U B 2 es base 
de V. 

Ejercicios adicionales 

1321 Considerese un juego identico a Lights out! pero con un tablero formado 
solo por cuatro casillas, como el siguiente: 


1 

2 

3 

4 


A1 pulsar sobre una casilla, cambia el estado de esa casilla, asi como sus adyacen- 
tes (en horizontal y vertical). Plantear el sistema de ecuaciones correspondiente 
a este tablero y averiguar si existe solution para la siguiente configuration initial: 


resolviendo el sistema mediante el metodo de Gauss, usando la aritmetica 
modular descrita en (4.12). 














5 Aplicaciones lineales 


\ ' - V I'',..'-. HM ' g ■ ■ ./ 


Las funciones constituyen sin duda alguna el objeto matematico de mayor 
interes y uso en cualquier disciplina en la que las matematicas tengan un mmimo 
de presencia. En este terna iniciaremos el estudio de las funciones relacionadas 
con los espacios vectoriales, mas conocidas corno aplicaciones lineales. 


□ a - 

APLICACIONES LINEALES ENTRE ESPACIOS VECTORIALES 


Basicamente podemos decir que una aplicacion lineal es aquella que respeta 
la estructura de espacio vectorial: 1 



Sean V y W dos espacios vectoriales sobre un mismo cuerpo K. Una aplica¬ 
cion / : V —> W se dice lineal si verifica: 


/(x + y) =/(x)+/(y), Vx,y£U 
/(ax) = a/(x) Vx, € V, Va £ K 


De forma equivalente, / es lineal si y solo si /(ax + /3y) = a/(x) + /3f( y), 
Vx, y £ V, Va, /? £ K. 

Como puede verse en la definition, una aplicacion lineal no es mas que una 
funcion definida entre espacios vectoriales que respecta la linealidad, es decir, la 
imagen de una combination lineal es la combination lineal de las imagenes. A 
pesar de su simplicidad, su importancia es enorrne en multitud de disciplinas. 
Veamos algunos ejemplos: 


1 Las transformaciones lineales ya aparecen en la ya citada obra de Grassmann que paso 
casi desapercibida en su epoca, aunque el concepto de linealidad aparece frecuentemente con 
anterioridad en numerosas aplicaciones. 
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(i) La aplicacion nula , definida por 

Oy : V 

v 

es lineal. 

(n) La aplicacion identidad dada por 

I v : V 

v 


V 

0 


V 

v 


es lineal. 

(ill) La simetri'a plana de eje la recta y = x, cuya ecuacion es 


a : K~ 

(x,y) 

es una aplicacion lineal. 

(iv) La aplicacion derivada es lineal: 


(y,x) 


d: Pr[x] —> Pr[x] 
p(x) —> p'(x) 

Algunos ejemplos de aplicaciones no lineales: 

fi : M —> R 


Si : 


sen a; 


Notaremos por C(V, W) al conjunto de aplicaciones lineales de V en W (tam- 
bien llamadas homomorfismos). Si V = W se dice que / es un endomorfismo , 
y al conjunto de tales aplicaciones se le denota por C{V). 

Se dice que / : V —> W es un isomorfismo si es lineal y biyectiva. Tambien 
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se dice que / es un automorfismo si es un endomorfismo biyectivo. 

□ □3 Propiedades 

De la definition de aplicacion lineal se deduce facilmente que la imagen 
de una combination lineal de vectores es igual a la combination lineal de las 
imagenes, es decir, 



(5.1) 


Algunas consecuencias inmediatas son: 



Si / : V —► W es lineal, entonces, 
(i) /(0) = 0 . 

(II) /(-u) = -/(u). 


(ill) Si L es un subespacio vectorial, f(L) = {/(v) : v £ L} tambien es un 
subespacio vectorial. 


La demostracion de este resultado es elemental y se propone al lector como 
ejercicio. 



Sea L un subespacio de dimension k y / una aplicacion lineal, entonces f(L) 
es un subespacio de dimension menor o igual que k. 


Demostracion: 

Sea {ei,...,efc} una base de L. Si y £ f(L) entonces existe x G L tal que 
/(x) = y. Como x £ L, podemos escribir que x = Y^i=i a i e i- Usando (5.1), 


y = / 



esto es, y es combination lineal de los vectores /(ei), ..., /(e*,). Por tanto 
estos vectores forman un sistema generador de f{L). Del Corolario 4.5 se sigue 
el resultado. 
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El siguiente resultado es esencial para la determination de una aplicacion 
lineal, y ademas pone de manifiesto la importancia de las bases en los e.v. 


—[” 



Sea B = {e!, . 
de W. Entonces 
/(e») = w i; 1 < 1 

.., e„} una base de V. Sean w 1; ..., w n n vectores cualesquiera 
existe una linica aplicacion lineal / : V —> W tal que 
< n. 


Demostracion: 

Sea v e V. Para definir /(v) procedemos como sigue. Puesto que B es una base 
de V existen unos unicos cm tales que v = ^” =1 cqe,. En tal situation definimos 

n 

/( v ) = H 

t=1 

Es facil comprobar que / es lineal y puesto que las coordenadas respecto de una 
base son unicas, / esta definida de rnanera unica. 

■ 

Como consecuencia, podemos afirmar que para determinar completamente 
una aplicacion lineal basta conocer las imagenes de los elementos de una base 
del espacio de partida. Con esta simple information (la imagen de unos cuantos 
vectores) podemos obtener la imagen de cualquier otro vector del espacio. 



Supongamos que conocemos que una aplicacion lineal satisface 
/(1,0) = (2,1,3), / (0,1) = (4, —1,0) 

Vamos a determinar la aplicacion. En primer lugar se trata de una aplicacion 
/ : R 2 —»• R 3 , y puesto que sabemos los valores de la aplicacion sobre una base de 
R 2 , esto es, conocemos la imagen de {(1, 0), (0,1)}, podemos calcular la imagen 
de cualquier vector (, x\,x %)• 

En efecto, usando coordenadas se tiene que 

{x 1 ,x 2 ) = aq(l, 0) + £ 2 ( 0 ,1) 


f{x i,x 2 ) = /(xi(l,0) +x 2 (0,1)) 

= a:i/(l, 0) + x 2 f( 0,1) = Xi(2,1,3) + *2(4, -1,0) 
= (2xi + 4x 2 , x\ — x 2 , 3xi) 


luego, 
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- 

MATRIZ DE UNA APLICACION LINEAL. 

Ya hemos visto que para determinar completamente una aplicacion lineal 
nos basta con conocer las imagenes de una base del espacio de partida. A 
continuation vamos a usar esta idea para describir con mayor eficacia una 
aplicacion lineal. 

Consideremos V y W dos e.v., f :V W una aplicacion lineal, y sean 
B = {ui,...u n } y B' = {vi,...v m } 
bases de V y W, respectivamente. 

Dado un vector x € V podemos escribir x = Y^j=i x j u ji usan do sus 
coordenadas. Entonces 

n 

/( x ) = H a: i/( u i) =y ( 5 - 2 ) 

i=i 

Obviamente y G W, de modo que, haciendo uso de la base de W, y = Vi^i- 
El objetivo que perseguimos es relacionar las coordenadas del vector de partida 
x con las coordenadas del vector de llegada y. 

Notese que cada vector /(u 3 ) G W, por lo tanto, puesto que tenemos una 
base de W, es posible escribir 


/( u j) = j = 

i-l 

es decir, a,j , 1 < i < m son las coordenadas de la imagen de f(uj) en la base 
de W. 

Usando esta ultima observation en (5.2) se tiene que 

n / m \ m / n \ m 

/( x ) = XI x i 53 a *J v ® 1=51(11 x i ai i Vi = 51 

i=i \*=i / *=l \i=i / i= l 

Como las coordenadas son unicas, vemos que 

n 

Vi = 55 X 3 a ij 
j =1 

Si ahora consideramos la matriz A = (a^-) entonces la igualdad anterior no 
es mas que el producto de la matriz A por las coordenadas del vector x. Es 
decir, /(x) = Ax. 

A la matriz A se le denomina matriz de / en las bases B y S', y se denota 
por Mg (/). Es importante observar como esta construida esta matriz: sus 

columnas estan formadas por las coordenadas, respecto de la base B ', 
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de las imageries de los vectores de la base B. Como las dimensiones de V 
y W son n y m , respectivamente, entonces A £ A4 mxn (K). 

En conclusion, toda aplicacion lineal tiene asociada una matriz respecto de 
unas bases predeterminadas (notese que la matriz cambiara si cambiamos de 
base). En adelante, fijadas las bases, identificaremos la aplicacion lineal con la 
matriz correspondiente, escribiendo /(x) = Ax. 

Reciprocamente, sea A £ A / l mX n(K) y fijemos unas bases B y B' en V y W, 
respectivamente. Podemos asurnir que las columnas de A son las coordenadas, 
respecto de la base B ', de las imagenes de los vectores de la base B: de este 
modo, (vease el Teorema 5.1) queda determinada una unica aplicacion lineal 
/ : V —> W, cuya matriz Mg' {f) = A. 

—- 

Si los espacios V y W coinciden y consideramos la misma base en ambos 
(que es lo mas natural), la matriz de la aplicacion correspondiente se notara por 


Ejemplo 5.3 (continuacion del ejemplo 5.2) 


Construyamos la matriz de la aplicacion dada. Puesto que conocemos las 
imagenes de la base canonica de R 2 

/(1,0) = (2,1,3), / (0,1) = (4, —1,0) 

directamente podemos escribir la matriz respecto de las bases canonicas de R 2 
y R 3 , respectivamente, que es 



Por tanto, para calcular f{x\, X 2 ) no tenemos mas que nmltiplicar por la matriz, 

'2 4 

f{x 1 ,x 2 ) = I 1 -1 



Recuerdese que trabajamos con los vectores por columnas (vease la nota 4.6 en 
la pag. 158). 
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Figura 5.1: Rotation de angulo a 



Matriz de una rotacion de angulo a enl 2 , respecto de la base canonica. 2 
Sea B c = {ei,e 2 }. Atendiendo a la figura 5.1, se tiene 


R(e i) = cos(a)ei + sen(a)e 2 
R(e 2 ) = — sen(a)e! + cos(cr)e 2 

de modo que la matriz de esta rotacion en la base canonica de R 2 es 

, „ I cos a — sen a 

MbAR) = 

\sen a cos a 



Matriz de una simetria respecto del piano X 3 = 0, en la base canonica de R 3 . 
Es facil comprobar que si ei, e 2 y e 3 son los vectores de la base canonica de 
R 3 , entonces 

cr(ei) = ei, cr(e 2 )=e 2 , cr(e 3 ) = -e 3 


2 Hacemos hincapie en el hecho de que la matriz depende de dos bases, la del espacio de 

partida y la del de llegada, pero en este caso, al tratarse del mismo espacio usamos la misma 
base. 
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z 
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(i) Matriz de la aplicacion lineal 

/: PS[x] —► PS -1 [*] 

p(x) —» p'( x) 

respecto de las bases B = {1, x,..., x n } y B' = {1, x ,..., a;" -1 }. 

Comenzamos calculando las imagenes de los elementos de B (la base del 
espacio de partida): 

/(!) = 0, f(x) = 1, f(x 2 ) = 2x, /Or”) = nx n ~ x 


y a continuation, escribimos estos vectores en coordenadas respecto de B’ 
(la base del espacio de llegada). Por tanto, 


<'(/) = 


0 1 0 0 
0 0 2 ••• 


£ -Ad n x(n+1)(®0 


0 0 0 


(n) Matriz de g : K 3 —> K 2 dada por 

g{x 1 ,X 2 , x 3 ) = (xi +X 2 + x 3 , X!+X 2 - X 3 ) 


respecto de la base canonica de K 3 y la base B' = {(1, 0), (1,1)} de R 2 . 

Calculamos la imagen de los vectores de la base canonica de R 3 y los 
escribimos como combination lineal de los vectores de la base de R 2 dada: 


5 ( 1 , 0,0) = (1,1) = an(l,0) + a 2 i(l, 1) => an = 0, a 2 i = 1 
g{ 0,1,0) = (1,1) = 012 ( 1 , 0) + a 22 (l, 1) => a 12 = 0, a 22 = 1 
5 ( 0 , 0,1) = (1, -1) = ai 3 (l, 0) + a 23 (l, 1) ^ a 13 = 2, a 23 = -1 

La matriz es por tanto, 


Ml(g) 
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Observese que el papel que juega la base del espacio de partida en la matriz 
de una aplicacion es completamente diferente al que juega la base del espacio de 
llegada: la primera es usada para obtener las imageries a traves de la aplicacion 
de cada uno de sus vectores; mientras que la segunda se emplea para escribir 
coordenadas respecto de esta base en el espacio de llegada. 


mm - 

OPERACIONES ENTRE APLICACIONES LINEALES 

En el conjunto de aplicaciones lineales entre dos espacios vectoriales C{V, W) 
podemos definir la suma de aplicaciones y el producto con un escalar del 
siguiente modo: 

+ : C{V,W) x C{V,W) —> C(V,W) 

(, f,9 ) — > f + g donde (/ + <?)(v) = /(v) + g(v) 

• : lx C{V, W) —■> C(V, W ) 

(a, f) —> a ■ f definida por (a ■ /)(v) = a/(v) 



Se puede probar que, con las operaciones anteriores, el espacio £(V, W) es 
un espacio vectorial de dimension (dim V) (dim W). 


El siguiente resultado muestra que las operaciones entre aplicaciones lineales 
pueden ser vistas corno operaciones entre sus matrices asociadas, respecto de las 
correspondientes bases. 



Si A y B son las matrices de las aplicaciones / y g en las bases 8 y S', 
respectivamente, entonces 


(i) A + B es la matriz de la aplicacion f + g e n las citadas bases, 
(il) aA es la matriz de la aplicacion a ■ f e n las mismas bases. 
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La demostracion es elemental y se propone al lector. 

Ademas de las operaciones suma y producto por un escalar, es importante 
prestar atencion a la composicion de aplicaciones lineales. 



Si / G C(V, W), g G £(W,X), A = ( f) y B = entonces 

BA = M%*(gof). 


Demostracion: 

Sean A = (a, 7 )iy B = (bki)i<k<p las matrices de las aplicaciones dadas 

l<j<n 1 <i<m 

en las bases correspondientes. Esto es, si 

Bv = {ei,... e„}, B w = Wi, ■ ■-e'm}, B x = {e",...e"} 
se tiene que 

n p 

f ( e j) = J2 a V e i> 9i e 'i) = bkie k 

i =1 k =1 

Entonces, 

( n \ n 

a b5(e') 

2=1 / 2=1 

n p p / n \ 

= ^ ' a i] 'y ' bkie k = y ( I ^ ' bkiOij j 

*=1 fc=l fc=l Vi=l / 

Para terminar basta observar que el parentesis del ultimo sumando corresponde 
al elemento kj de la rnatriz BA. 


El resultado anterior nos dice que la composicion de aplicaciones lineales se 
traduce en la multiplication de sus matrices asociadas, en el orden en el que 
escribimos tal composicion (que no es el orden en el que actuan). Este heclio se 
extiende a la aplicacion inversa. 



Sea / una aplicacion lineal de V en W. Entonces, 
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(i) La inversa de una aplicacion lineal es lineal y (/ _1 ) _1 = /■ 

(n) / es invertible si y solo si es biyectiva. 

(ill) Si / : V —> W es biyectiva y tiene a A £ M n (K) como matriz asociada res- 
pecto de ciertas bases, entonces / -1 tiene como matriz asociada respecto 
de las mismas bases a A~ x . 


Demostracion: 


(i) De la definition de aplicacion inversa (vease la section A.2) es inmediato 
que (/ _1 ) _1 = /. Veamos ademas que la inversa es lineal; para ello sera 
necesario probar que 

/ _1 (ax + fly) = a/ _1 (x) + /3/ _1 (y) (5.3) 

Pongamos que / _1 (x) = x' v / _1 (y) = y'; es decir /(x') = x y /(y') = y. 
Como / es lineal, 

/(ax' + /?y') = a/(x') + /3f( y') =ax + ^y 

y por definition de inversa, / -1 (ax + /3y) = ax' + /?y' = a/ _1 (x) + 
/3/ _1 (y), que es precisamente (5.3). 

(n) La suficiencia (es decir, que el hecho de que la aplicacion sea biyectiva 
implica que existe inversa) es inmediata, pues si una aplicacion es inyec- 
tiva, entonces existe inversa, y ademas como es sobreyectiva, entonces la 
inversa esta definida para todo vector de W. 

Para la necesidad (esto es, si la aplicacion es invertible, entonces es 
biyectiva), veamos que / es inyectiva y sobreyectiva. Sean x e y en V 
tales que /(x) = /(y). En tal caso, /(x — y) =0. Por otra parte, 
como / -1 es lineal / -1 (0) = 0 (segun (i), Proposition 5.1), pero ademas 
/ -1 (0) = x — y, luego x = y; es decir, / es inyectiva. 

Para la sobreyectividad, sea y € W. Como existe inversa, / -1 (y) = x, 
para algun vector x € V, es decir, /(x) = y. La arbitrariedad de y nos da 
la sobreyectividad. 

(in) En primer lugar tengamos en cuenta una consecuencia inmediata de un 
resultado que probaremos mas adelante (Teorema 5.3), del cual se deduce 
que si / : V —> W es biyectiva, entonces dim(P) = dim(bE). Teniendo 
esto presente, consideremos / : V —> W biyectiva y una matriz asociada 
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a / respecto de ciertas bases en estos espacios que llamaremos A. Por el 
comentario anterior, A debe ser una matriz cuadrada. 

Por otra parte, corno acabamos de probar, al ser / biyectiva existe inversa 
y ademas es lineal, : W —> V, por lo que podemos considerar su matriz 
asociada, B, (tambien cuadrada) respecto de las mismas bases de W y V, 
respectivamente. 

Consideremos ahora la composition / -1 o /; esta aplicacion resulta la 
identidad de V en V, y al ser lineal (composition de aplicaciones lineales) 
su matriz asociada respecto de la misma base de V sera la matriz identidad, 
I. 

Finalmente, usando la Proposition 5.4, la matriz BA corresponded a la 
composition de / con / -1 , de modo que BA = I. Dado que A y B son 
cuadradas y su producto es la identidad, se tiene que B = A~ x (vease la 
Proposition 2.5). 



Consideremos las siguientes aplicacion lineales: 

/ : R 3 — > R 2 definida por f(x i, x 2 , x 3 ) = ( x\ + 2x 2 — x 3 , —X\ + x 2 + 2x 3 ) 
g : R 3 —> R 2 dada por g(xi,x 2 , x 3 ) = (3a:i — x 2 ,x\ — x 3 ) 
h : R 2 — > R 2 definida por h(xi,x 2 ) = ( 2x± + x 2 , —x\ — x 2 ) 

y calculemos (/ + g), (3 • /) y hr 1 . Es inmediato comprobar que 

(/ + g)(xi,x 2 , x 3 ) = (xi + 2x 2 - x 3 , -x i + x 2 + 2x 3 ) + (3xi - x 2 , Xi - x 3 ) 
= (4xi + x 2 — x 3 , x 2 + x 3 ) 

(3 • f){xi,x 2 ,x 3 ) = 3 ■ (xi + 2x 2 - x 3 , -x 1 + x 2 + 2x 3 ) 

= (3x\ + &x 2 — 3x 3 ,—3x\ + 3x 2 + &x 3 ) 

Para el calculo de hr 1 escribimos h(x\,x 2 ) = (yi,j/ 2 ) y despejamos X\ y x 2 : 



xi = yi+ V 2 
x 2 = -yi - 2y 2 


de modo que h t (yi,y 2 ) = (yi + y 2 , ~yi - 2y 2 ). 
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Veamos ahora como obtener estas aplicaciones a traves del calculo con 
matrices. Consideremos las bases canonicas enR 3 yR 2 , y las matrices respecto 
de estas bases de /, g y h: 


M(f) 



M(g ) 



M(h) 



Notese que estas matrices se pueden calcular tal y como hemos comentado en la 
section 5.2. No obstante, es interesante observar que cuando tenemos expresiones 
anaHticas de las aplicaciones y queremos obtener la matriz respecto de las bases 
canonicas, esta se obtiene escribiendo por filas los coeficientes de cada una de 
las componentes de la expresion analitica. 

Ahora es sencillo ver que 


M(f + g) 





M {3 • /) = 3 




/ 3 6 s\ 
\-3 3 6 ) 


M(h~ 1 ) 




BQ - 

CAMBIO DE BASE EN UNA APLICACION LINEAL 

Hemos visto que la matriz de una aplicacion lineal depende de las bases que 
hayamos elegido en los espacios de partida y de llegada. Ahora veremos que 
ocurre cuando realizamos un cambio de bases en los espacios. 

Supongamos que tenemos una aplicacion lineal / : V —> W y las bases en V 
y W siguientes: 


B v = {ui,...,u„} B' v = {u'|,..., u' n } 

B w = {v i,...,v m } B' w = {vi,... ,v' m } 

Denotemos por A = Mg™ (f) y A' = Mg, w (/). Nuestro interes esta en 
encontrar la relation entre las matrices A y A'. 
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Para ello usaremos la relacion entre las bases de cada uno de los espacios: 
en concreto, si C = MS, v , es la matriz de carnbio de base en el espacio V de la 

°V 

base B' v a By, entonces sabemos que, si x son las coordenadas en la base By y 
x' son las coordenadas en la base B' v se tiene que x = Cx'. 

B’ 

Del mismo modo, si consideramos D = M„ w la matriz de carnbio de base 

’ >~>W 

de la base Bw a B' w en el espacio W , entonces y' = D y, donde y denota las 
coordenadas respecto de Bw e y' las coordenadas respecto de B' w . Notese que 
como las matrices de carnbio de base son invertibles (Teorema 4.6), tambien 
podemos escribir y = D~ 1 y'. 

Con estas notaciones se tendra que y = Ax ey' = A'x'. 

Ahora es sencillo establecer la relacion entre Ay A': 

y = Ax => D~ l y' = A(Cx') => y' = DACx' 


luego A' = DAC. 

El siguiente diagrama puede ayudar a esclarecer mejor la situation: 


/ : V -* W 



El camino que enlaza la matriz A' puede ser recorrido en la direction que usa 
la matriz A. Es decir, A' es equivalente a hacer actuar primero C, luego A y 
finalmente D. Como la composition se multiplica en orden inverso al orden de 
actuacion obtenemos la igualdad entre matrices anterior. 



(i) Sea / : R 3 —> R 2 la aplicacion lineal dada por f(x i, X 2 , * 3 ) = (X 1 +X 2 , X 3 ) 
y consideremos las bases 

B = {(1,1,1), (1,1,0), (1,0,0)}, B' = {(1,1), (1, -1)}, 
de R 3 y R 2 , respectivamente. Calculemos M® (/). 

Para encontrar dicha matriz podemos proceder de dos maneras. Median- 
te la definition de la matriz de una aplicacion respecto de unas bases, 
debemos calcular la imagen de los elementos de B y escribirlos como com- 
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binacion lineal de los elementos de B'. Asi, 

/(l) 1) 1) = (2,1) = au(l, 1) + a 21 (l, —1) 

/(l, 1 , 0 ) = ( 2 , 0 ) = a 12 (l,l) + 022(1,-1) 
/(l) 0,0) = (1,0) = a 13 (l, 1) + a 23 (l, —1) 


2 — On + 021 

1 = On — 021 

2 = 012 + 022 
0 = Oi2 — 022 

1 = O13 + 023 
0 = Oi3 — 023 


Resolviendo los sistemas obtenemos 

0(11 = 2> °21 = \i a 12 = 1; 022 = 1, Ol3 = 0-23 = 2> 

luego, 


<'(/) = 


-2 1 i 
i 1 i 


Otra forma de calcular esta matriz con un menor numero de operaciones 
consiste en calcular la matriz de la aplicacion respecto de las bases canoni- 
cas de ambos espacios (que es inmediata de obtener, como comentamos en 
el ejemplo 5.7) y efectuar el correspondiente cambio de base. Asf, si deno- 
tarnos por S®3 y 0 ®2 a las bases canonicas de R 3 yR 2 , respectivamente, 
se tiene que 

\ 1 o\ 


M£?(f) = 


.0 0 1 , 


Atendiendo al diagrama, 


/: 


m |® 3 


B 




ME'if) 


1 < 2 


B' 


obtendremos que Mg (/) = Mg 2 Mg* 3 (/)Mg® 3 . Por tanto solo tenemos 
que encontrar las matrices de cambio de base. Estas son: 


Mg = 



Ml' = 

S K 2 


1 r 
.1 


-1 
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(recordemos que Mg = (Mgf 2 ) 1 ), de manera que 


Mg'if) = 



k 1 


(ii) Sean B = {ui,u 2 } y B' = {ui + 2u 2 ,2ui + 3u 2 } bases de R 2 , y / el 
endomorfismo cuya matriz respecto de la base B viene dada por 


A = Mjs(f) 



La matriz de / respecto de la base B' se deduce a partir del siguiente 
diagrama: 


/:R 2 



A 


A' 


R 2 



c - 1 


donde C = Mg, es la matriz de cambio de base de B' a B. Recordemos que 
para obtener esta matriz debemos escribir por columnas, las coordenadas 
de los vectores de B' respecto de B , es decir 


C = M§,= 



Finalmente, 


A'= M B ,(f)=C~ 1 
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Dado el piano vectorial V = X\ — a ; 2 + 2 x 3 = 0, encontrar la matriz respecto 
de la base canonica de R 3 de la simetria axial de eje V. 

En este caso puede ser complicado calcular las imagenes de los vectores de 
la base canonica directamente, sin embargo, simples razonamientos geometricos 
nos pueden permitir calcular las imagenes de ciertos vectores de R 3 que formen 
una base. Por ejemplo, la imagen por la simetria pedida de cualquier vector 
contenido en V es el propio vector. Puesto que V es un subespacio de dimension 
dos, podemos extraer dos vectores l.i. sin mas que resolver la ecuacion dada. En 
este caso, 


x\ = x 2 - 2x 3 => ui = (1,1,0), u 2 = (-2,0,1) G V 

Obtener un tercer vector que forme base con los anteriores es bien sencillo, 
pero tal vez no sea facil encontrar su imagen mediante la simetria. En tal 
caso, la rnejor opcion consistira en escoger corno tercer vector uno que, siendo 
independiente con los anteriores, su imagen sea sencilla de obtener. El candidato 
idoneo sera un vector perpendicular a V, puesto que la simetria simplemente 
invierte el sentido de dicho vector (es decir, le carnbia el signo). 

Por geometria elemental se sabe que el vector formado por los coeficientes de 
la ecuacion que define a V es perpendicular a este (en el tema 8 justificaremos 
este heclro), luego elegimos como tercer vector u 3 = (1,—1,2). Tomando como 
base B = {ui, u 2 , u 3 }, es inmediato obtener la matriz de la simetria respecto de 
esta base, pues 


/(Ui)=Ui, /(u 2 ) = u 2 , /(u 3 ) =-u 3 


La matriz queda 


MbU) 



Para hallar la matriz respecto de la base canonica simplemente usamos el 
cambio de base oportuno. En este caso 
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Como podemos deducir de (il) del ejemplo anterior, si V = W, es decir, el 
espacio de partida y el de llegada son el mismo, y tomamos la misma base en 
ambos espacios, entonces A! = C~ 1 AC. Si ahora usamos el Teorema 2.16 es 
inmediato comprobar que |A| = \A'\. Es decir si / £ £(V) todas sus matrices 
asociadas poseen el mismo determinante. 


mm - 

NUCLEO Y RANGO DE UNA APLICACION LINEAL 


Dada una aplicacion lineal existen un par de conjuntos asociados a partir de 
los cuales se pueden obtener de rnanera inmediata propiedades interesantes de 
la misma. Definimos estos conjuntos a continuacion. 



Sea / : V —► W una aplicacion. Se define el nucleo de / como el conjunto 


ker(/) = {v € V : /(v) = 0} 

Se define la imagen de / como 

Im(/) = {w € W : 3v £ V tal que /(v) = w} = {/(v) : v £ V} = f(V) 


Basicamente, el nucleo esta constituido por aquellos vectores del espacio de 
partida que la aplicacion transforma en el vector nulo. Por su parte, la imagen 
esta formada por los vectores del espacio de llegada que son imagen de algun 
vector del espacio de partida. 



Sea / : V —► W una aplicacion lineal, entonces ker(/) y Im(/) son subespa- 
cios vectoriales de by W, respectivamente. 


Demostracion: 

Usaremos la Proposicion 4.9. Para ello, sean u y v £ ker(/) y veamos que 
qu + /3v tambien esta en ker(/). En efecto, 


/(cm + /3v) = af{ u) + /3/(v) = 0 
















210 


Tema 5 ■ Aplicaciones lineales 


Del mismo modo, si u, v G Im(/), veamos que cm + /3v tambien esta en Im(/). 


u G Im(/) => 3x G V : /(x) = u 
v G Im(/) =» 3y G V : /( y) = v 


Luego, 

cm + /Jv = a/(x) + /3/(y) = /(ax 
Como ax + /3y G Id, se tiene el resultado deseado. 


■/3y) 


— G 



Sea / : V W 
ker (/) = {0}. 

una aplicacion lineal. Entonces, / es inyectiva si y solo si 


Demostracion: 

Supongamos que / es inyectiva y que x G ker(/). Entonces /(x) = 0 = /(0) 
(vease (i), Proposition 5.1). De la inyectividad deducimos que x = 0, luego 
ker(/) = { 0 }. 

Veamos la implicacion contraria. Si /(x) = /( y) entonces /(x — y) = 0. Es 
decir, x — y G ker(/). Como por hipotesis el nucleo se reduce al cero, x y = 0, 
y por tanto / es inyectiva. 


Sea / : R 2 —> R 3 dada por f(xi,x 2 ) = (2x± + x 2 , X\ + 2x 2 , 3xi). 
La matriz de / en las bases canonicas de ambos espacios es 


A = 




Para encontrar el nucleo buscamos los vectores de R 2 (recordad que el nucleo 
esta en el espacio de partida) tales que f(xi,x 2 ) = (0, 0, 0); es decir 



2 xi + x 2 = 0 

X\ + 2x2 = 0 

3xi = 0 


cuya unica solution es el vector (0, 0). Por tanto / es inyectiva. 
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Es interesante observar que para encontrar los vectores del ker(/) hemos 
de resolver un sistema homogeneo cuya matriz coincide con la matriz de la 
aplicacion lineal /. Sabemos que un sistema homogeneo tiene soluciones distintas 
de la solution trivial siempre que rango(A) < n° de incognitas. En el ejemplo 
anterior, puesto que rango(A) = 2, pudimos haber deducido automaticamente 
que ker(/) = {0}, sin necesidad de escribir ni resolver el sistema anterior, 
simplemente estudiando el rango de la matriz de la aplicacion. 



Si A es la matriz de una aplicacion lineal respecto de unas bases dadas, el 
sistema Ax = 0 es un sistema de ecuaciones implfcitas de ker(A) y por tanto 
dim(ker(A)) = n — rango(A), donde n = dim V (el espacio de partida). 



Sea B = {ei,..., e„} una base de V. Entonces el conjunto 

{/( e i),...,/(e„)} 
es un sistema generador de Im(/). 


Demostracion: 

Sea w £ Im(/), entonces 3v £ V tal que /(v) = w. Ahora bien, v € V y B es 
una base de este espacio, por tanto 

n / n \ n 

V = £ 0 ii&i => w = /(v) = / a*ei = ^/(e,) 

i-i \i=i J i=i 

Es decir, hemos escrito un vector arbitrario de Im(/) como combination lineal 
de los vectores /(e i), ... ,/(e„). De aquf se obtiene el resultado. 



Observese que las columnas de la matriz de la aplicacion / son precisamente 
las imagenes de una base de V. Por tanto, los vectores cuyas coordenadas 
corresponden a las columnas de esta matriz forman un sistema generador de 
la Im(/). Es decir dim(Im(/)) = rango(A). 
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En particular, todas las matrices de una misma aplicacion lineal tienen el 
mismo rango, de ahi que hablemos del rango de una aplicacion. 



Sea / : R 5 —»• M 3 dada por 

fix l, X 2 , X 3 , X4, X 5 ) = (xi + X 2 + X 3 + X4 + X 5 , X 2 ~ X4 + X 5 , X\ + X 3 + 2X4) 

Estudiar ker(/) y Im(/). 

En primer lugar escribimos la matriz de / en las bases canonicas: 3 




111 11 


A = 


0 10-11 


10 1 2 0 


Un simple calculo nos muestra que rango(A) = 2 (un menor no nulo esta formado 
por las primeras dos filas y columnas). Por tanto dim(ker(/)) = 5 — 2 = 3 y 
dim(Im(/)) = 2. 

Para encontrar una base de Im(/) solo tenemos que encontrar vectores l.i. 
de entre las columnas de A (en este caso los correspondientes a las dos primeras 
columnas). Es decir, 


Im(/)= £((1.0,1), (M,0)) 

Para obtener una base de ker(/) resolvemos el sistema Ax = 0 (solo 
consideramos las ecuaciones relevantes): 



Una base de soluciones es {(—1,0,1, 0, 0), (—2,1,0,1,0), (0, —1, 0, 0,1)}. 


3 Siempre que no se especifique una base distinta escogeremos estas bases, pues son las mas 
sencillas. 
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Sea / : V —>■ W lineal. Entonces 

dim(V) = dim(ker(/)) + dim(Im(/)) 


La demostracion de este resultado es inmediata a partir de las notas 5.5 y 
5.6. Como consecuencia se tiene el siguiente: 



Sea / : V —► W lineal con matriz asociada A respecto de ciertas bases. 
Entonces, 

(i) / es inyectiva si y solo si rango(^4) = dim(C). 

(n) / es sobreyectiva si y solo si rango(A) = dim(W). 



Como consecuencia del resultado anterior, una aplicacion / : K 71 —► R m con 
n > m no puede ser inyectiva, asi como una aplicacion de K™ en M m con n < m 
no puede ser sobreyectiva. 


Resumimos los resultados anteriores en el siguiente teorema. 



Sea / :V —>W lineal. Si dim(F) = dim(W), son equivalentes: 


(i) / es biyectiva. 

(n) f es inyectiva. 

(ill) / es sobreyectiva. 
(IV) ker(/) = {0}. 

(v) rango(/) = dim(E). 
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CALCULOS CON PYTHON 

Practicamente todos los conocimientos de Python que se necesitan para 
abordar los calculos que se realizan en este tema han sido ya expuestos en temas 
anteriores (operaciones con matrices, resolution de sistemas y calculo de rangos), 
sin embargo, aim no hemos hecho uso de una funcion de especial utilidad que nos 
va a permitir obtener el nucleo de una aplicacion de forma sencilla: nullspace. 
Esta funcion, que forma parte del modulo SymPy, nos proporciona una base del 
ker(A), donde A es una matriz cualquiera. Se usa del siguiente modo: 


1 

>>> from sympy import Matrix 

2 

>>> A = Matrix([[l,1,1,1,1] , [0,1,0,-1,1] ,[ 1 , 0 , 1 , 2 , 0 ]]) 

3 

>>> A .nullspace() 

4 

[[-1] 

5 

[ 0] 

6 

[ 1] 

7 

[ 0] 

8 

[ 0] , [-2] 

9 

[ 1] 

10 

[ 0] 

11 

[ 1] 

12 

[ 0] , [0] 

13 

[-1] 

14 

[ 0] 

15 

[ 0] 

16 

[ 1]] 


Como vemos, la respuesta de este modulo, que funciona sobre una matriz de 
SymPy, nos proporciona una lista de vectores (en realidad son matrices colunma) 
que corresponde a una base del espacio ker(A). De hecho, en este caso dicha base 
coincide con la obtenida por nosotros en el ejemplo 5.11, aunque es evidente que, 
en general, no tiene por que ser ash 

El interes de este modulo es que imph'citamente nos esta proporcionando el 
rango de la matriz, de manera que podemos definir ahora una funcion rango 
que trabaje sobre matrices de SymPy: 

1 def rango(A) : 

2 x = A.cols - len(A.nullspace () ) 

3 return x 


El atributo cols hace referenda al numero de columnas de A (la dimension del 
espacio de partida). 

Ademas, nullspace tambien puede ser usado para calcular una base de 
un subespacio vectorial que venga definido por un sistema de ecuaciones ho- 
mogeneo: 
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1 

>>> from numpy import matrix 

2 

>>> from sympy import Matrix 

3 

>>> a=matrix(’l 1 1 1; 0 0 1 1’) 

4 

>>> A=Matrix(a) 

5 

>>> A.nullspace() 

6 

[[-1] 

7 

[ 11 

8 

1 0] 

9 

[ 0] , [0] 

10 

[ 0] 

11 

[-1] 

12 

[ HI 


El codigo anterior significa que el subespacio 


L\ 


x\ + x 2 + x 3 + Xa = 0 
x 3 + X 4 = 0 


tiene como base 

{( 1 ,- 1 , 0 , 0 ), ( 0 , 0 ,- 1 , 1 )} 

(vease el ejemplo 4.18). 

Notese que hemos usado matrix de NumPy para simplificar la entrada de 
la matriz, aunque luego hemos de usar Matrix de SymPy que es el objeto para 
el que esta definido nullspace. 


mi - 

APLICACION A LA CRIPTOGRAFIA 

La criptografia es la tecnica que altera una representation lingiustica de un 
mensaje para mantener su privacidad. La information a transmitir es encrip- 
tada o codificada de forma que se haga ilegible hasta que sea descodificada o 
desencriptada. Para ello se emplea algun tipo de information secreta (la clave 
de encriptacion) que debe ser conocida solo por el emisor y el receptor de la 
information. 

Una de las tecnicas criptograficas mas sencillas consiste en enmascarar el 
mensaje original convirtiendolo en un mensaje cifrado empleando para ello la 
sustitucion de los caracteres que conforman el mensaje (por ejemplo, cambiar 
la a por la k, la b por la d , etc.). Pero este tipo de codification es facil de 
romper analizando la frecuencia de aparicion de las letras del alfabeto. En esta 
section vamos a mostrar una tecnica criptografica sencilla, pero mas segura que 
la sustitucion, que esta basada en el uso de aplicaciones lineales. 

Supongamos que queremos enviar el siguiente mensaje: 


ALGEBRA LINEAL CON APLICACIONES Y PYTHON 
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En primer lugar vamos a sustituir los caracteres del mensaje por numeros, 
siguiendo un sencillo proceso de sustitucion, para el que usamos la siguiente 
tabla: 


A 

B 

C 

D 

E 

F 

G 

H 

I 

J 

K 

L 

M 

N 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

N 

O 

P 

Q 

R 

S 

T 

U 

V 

w 

X 

Y 

Z 

- 

15 

16 

17 

18 

19 

20 

21 

22 

23 

24 

25 

26 

27 

28 


El mensaje codificado seria este: 


1 12 7 5 2 19 1 28 12 9 14 5 1 12 28 3 16 14 28 1 17 12 9 3 1 3 9 16 14 5 20 28 

26 28 17 26 21 8 16 14 


Simplemente hemos sustituido cada letra por el numero correspondiente, inclui- 
dos los espacios. Si enviaramos el mensaje de este modo, un sencillo analisis 
basandonos en la mayor frecuencia de aparicion de ciertos numeros nos permi- 
tirfa descifrar el mensaje. Sin embargo, vamos a codificar de nuevo el mensaje 
haciendo uso de una aplicacion lineal biyectiva. 

En primer lugar, agruparemos las cifras de las que consta el mensaje en 
grupos de 3: 


(1,12,7) (5,2,19) (1,28,12) (9,14,5) (1,12,28) (3,16,14) (28,1,17) 
(12,9,3) (1,3,9) (16,14,5) (20,28,26) (28,17,26) (21,8,16) (14,0,0) 


Notese que hemos anadido dos ultimos numeros (0) para completar las ternas. 
Cada uno de estos grupos es un elemento de R 3 , de modo que vamos a transfor- 
marlos en un nuevo elemento de R 3 mediante una aplicacion lineal biyectiva, es 
decir, vamos a multiplicarlos por una rnatriz invertible. Para simplificar nuestros 
calculos, elegiremos una rnatriz de enteros, cuya inversa tambien este formada 
por enteros, por ejemplo: 


A = 



5 
3 

6 



Alrora transformamos cada uno de los vectores mediante esta rnatriz; esto se 
puede hacer directamente asf: 


2 

5 

3 \ 


f 1 

5 

1 

9 

1 

3 

28 

12 

1 

16 

20 

28 

21 

!4\ 

1 

3 

2 

II 

12 

2 

28 

14 

12 

16 

1 

9 

3 

14 

28 

17 

8 

0 

3 

6 




19 

12 

5 

28 

14 

17 

3 

9 

5 

26 

26 

16 

o J 

' 83 

77 

178 

103 

146 

128 

112 

78 

44 

117 

258 

219 

130 

28^ 

51 

49 

109 

61 

93 

79 

65 

45 

28 

68 

156 

131 

77 

14 

103 

103 

219 

131 

187 

161 

158 

102 

57 

152 

332 

290 

175 

42, 
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y entonces, el mensaje que enviamos es este: 

83 51 103 77 49 103 178 109 219 103 61 131 146 93 187 128 79 161 112 65 158 
78 45 102 44 28 57 117 68 152 258 156 332 219 131 290 130 77 175 28 14 42 

Observese, por ejemplo, que la repetition de la cifra 28 en la primera 
sustitucion podria ser una pista para determinar los espacios, sin embargo, ahora 
no existe tal repetition; de hecho, pocas son las cifras que se repiten. 

Para descodificar el mensaje es fundamental que la aplicacion usada sea 
biyectiva, pues debemos asegurarnos de que existe matriz inversa. Asi, volviendo 
a agrupar el mensaje recibido en vectores tridimensionales: 


(83,51,103) (77,49,103) (178,109,219) (103,61,131) (146,93,187) 
(128,79,161) (112,65,158) (78,45,102) (44,28,57) (117,68,152) 
(258,156,332) (219,131,290) (130,77,175) (28,14,42) 


bastara multiplicar por A 1 , donde 



para recuperar los digitos de la sustitucion: 


/ 0 

-2 













2 

-1 

-ti 

I- 











V-3 

3 

0 












83 

77 

178 

103 

146 

128 

112 

78 

44 

117 

258 

219 

130 

28 

51 

49 

109 

61 

93 

79 

65 

45 

28 

68 

156 

131 

77 

14 

103 

103 

219 

131 

187 

161 

158 

102 

57 

152 

332 

290 

175 

42 



( 1 

5 

1 9 

1 

3 

28 

12 

1 16 

20 

28 

21 

14 \ 


= | 

12 

2 

28 14 

12 

16 

1 

9 

3 14 

28 

17 

8 

0 



7 

19 

12 5 

28 

14 

17 

3 

9 5 

26 

26 

16 

0 J 


Es sencillo implementar en Python funciones que codifiquen y descodifiquen 
mensajes, empleando el metodo anterior. Para facilitar la implementation hemos 
usado un tipo de dato no visto liasta el momento: los diccionarios. 

Los diccionarios son una especie de arreglos, pero que en lugar de estar 
indexados por numeros, lo estan por cualquier tipo de clave. Por ejemplo, 


>>> dic={’Gauss’ 

’1777 ’ 

’Grassmann ’ 

’1809 ’ 

’Hamilton 

’ : ’1805 ’ } 
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Hemos definido un diccionario que vincula los nombres de tres matematicos con 
su ano de nacimiento. En este caso la clave es el nombre y el valor asociado a 
la clave el ano de nacimiento. Podemos acceder a los elementos del diccionario 


2 

3 

4 

5 

y podemos acceder a listas conteniendo las claves del siguiente modo: 

6 
7 


>>> die.keys () 

[’Grassmann ’ , ’Hamilton*, ’Gauss’] 


como si fuera un arreglo: 

>>> dic[’Gauss’] 

’1777 ’ 

>>> die[’Hamilton’] 

’ 1805 ’ 


La principal ventaja de un diccionario es la facilidad con la que Python accede 
a sus elementos, lo que lo hace ventajoso para nuestros propositos. 


A continuation mostramos un codigo para encriptar y desencriptar mensajes: 


1 

2 


3 

4 

5 

6 
7 


10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 
21 


#! /usr/bin/python 
# coding: UTF-8 -*- 


from sys import exit 

from numpy import array,dot 


diccionario = 

{ ’ a ’ : ’ 

1 ’ 

> 

b ’ : ’ 

2 

’ , ’c’: ’3 ’ 

, ’ d ’ 

>4’ , 

’ e ’ : 

’5 ’ , >f 

’ : ’ 6 ’ , ’ g’ : 

’7’ , ’h 

) . 

8 

’ , ’ i 

’ : 

>9’ , ’ j ’ : 

10 ’ , 

>k’ : 

’ll ’ , 

’ 1 

•: ’12’,’m’ 

■ ’13 ’ , 

’ n 


’ 14 ’ 

, 

’\xc3 ’ : ’ 

, ’ \xbl ’ : 

’15’ , 

’ 0 

’ : ’16 ’ , ’p ’ 

:’17> , 

’q 


’ 18 ’ 

» 

r’: ’19 ’ , 

’s’:’ 

20 ’ , 

t ’ : ’ 

21 ’ , ’u 

’ : ’22’ , ’v ’ 

’ : ’28 ’ > 

: ’23 ’ , 

’ w 

. 

’24 ’ 

» 

x’ : ’25 ’ , 

’7’: ’ 

26 ’ , 

z ’ : ’ 

27 ’ , ’ 

diccion = { ’ 1 

. ) a ) 

• a > 

2 ’ 


b’ , 

3 

’ : ’ c’ , ’4 ’ 

: ’ d ’ 

’5’ : 

’ e ’ , 

’6 ’ : ’f 

’ . ’7’: ’g’ , 

’8 ’ : ’h 

) 

9 

’ : ’ i 

) 

’10’ : ’ j ’ 

, ’ll ’ 

: ’k ’ 

’ 12 ’ 

: ’ 1 

’ , >13’: ’m’ 

, ’14 ; : 

’ n 

> 

’ 15 ’ 


\xc3\xbl 

, ’ 16 

’ : ’ o 

, ’17 

’ : ’p 

h- 4 - 

00 

& 

, >19 ’ : 

’ r 

i 

’ 20 ’ 

. 

s’ , ’21 ’ : 

’t ’ , ’ 

22 ’ : 

u’ , ’ 

23 ’ : ’ v 

’ , ’24’: ’w’ 

, ’25 ’ : 

’ X 


’ 26 ’ 

. 

y’ . ’27’ : 

r-, J ) 

28 ’ : 

) 

J 

0’ : ’ 


Mcod = array ([[2,5,3], [1,3,2], [3,6,4]]) 

Mdecod = array([[0,-2,1], [2,-1,-1], [-3,3,1]]) 

def sustitucion(mensaje) : 

mensus = [] 

for v in mensaje: 

if v in diccionario.keys(): 
if v ! = ’ \xc3 ’ : 

mensus.append(diccionario[v]) 

else : 
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exit(’El mensaje contiene caracteres no 
permitidos’) 


if len(mensus) "/, 3 = = 0 : 


return 

mensus 


elif len (m 

ensus ) "/,3 

==1 : 

mensus 

.append( 

’O’) 

mensus 

.append( 

’O’) 

else : 



mensus 

.append( 

’O’) 


return mensus 

def desustit(lista): 
texto =’’ 
for v in lista: 

texto += diccion[str(v)] 
return texto 


def crypt(lista,d=l): 
n=len(lista)/3 
a=array(lista,int) 
a=a.reshape(3,n).T 
if d==l: 

res=dot(Mcod,a) 
else : 

res=dot(Mdecod,a) 
res=res.T.reshape(3*n) 
criptado = list (res) 


re 

turn criptad 

0 




texto= 

ran.input() 





mensaj 

e = crypt ( sust 

ituc 

i on 

(texto 

)) 

print 

"Este es el 

mens 

a j e 

a env 

iar : " 

print 

mensaj e 





print 

) ) 





descod 

=desustit(cr 

ypt ( 

men 

saj e , 0 

) ) 

print 

"Este es el 

mens 

aje 

desco 

dific ado 

print 

descod 






II 


En la lmea 7 definimos un diccionario que corresponde a la tabla de sustitu- 
ciones (5.4). Hay un pequeno detalle concerniente a la letra n. Aunque hemos 
puesto la codification correspondiente (lmea 2), la lectura del caracter fl en 
Python plantea algun problema tecnico que hemos resulto definiendo en el die- 
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cionario los caracteres \xc3 y \xbl. Esto es debido a que la n es un caracter 
doble compuesto por \xc3\xbl. 

Este diccionario se emplea en la sustitucion inicial del mensaje de texto por 
una lista de numeros correspondientes a cada letra del mismo. Para realizar esta 
conversion definimos una funcion sustitucion (li'nea 14) cuya entrada es una 
cadena de caracteres, y cuya salida es una lista con los numeros correspondientes. 
La parte principal de la funcion consta de un bucle que recorre cada uno de los 
caracteres que conforma el texto entrante (linea 17). 4 Para cada caracter, se 
comprueba que este esta en el diccionario: si esta, entonces se afiade a la lista 
el elemento del diccionario correspondiente a ese caracter (linea 20), salvo que 
sea el primer caracter de la n, que se ornite; y si no esta, entonces el codigo se 
detiene pues no esta preparado para admitir mensajes que contengan otro tipo 
de caracteres. 5 Observese el uso del modulo append para anadir un elemento al 
final de una lista. 

Por ultimo, anadimos tantos caracteres 0 corno necesitemos para que la 
longitud de la lista permita su agrupacion en ternas (lineas 24-30). Notese el uso 
de la division modular (resto de la division por un numero) con el operador 7,. 

Una vez convertido el texto a una lista de numeros hernos de codificarlo me- 
diante la funcion crypt (linea 42), que esencialmente lo que hace es multiplicar 
por la matriz de codificacion. Esta funcion adrnite como parametro de entrada 
una lista y un valor entero d, que por defecto es igual a 1. 

Basicamente, la funcion crea una matriz (en este caso, tipo array de NumPy) 
de tamano 3 x n, donde n es igual a la longitud de la lista dividida por 3. En la 
creation del arreglo en la linea 44 especificamos expresamente el tipo (entero) 
de los datos; lo hacemos asi, pues la lista esta formada por cadenas de texto y 
no numeros, como es necesario para poder multiplicar por la matriz. 

Por otra parte, dado que la codificacion y la descodificacion suponen mul¬ 
tiplicar por una matriz (o por su inversa) hemos usado la misma funcion para 
realizar las dos acciones. Para ello usamos el parametro d, que si vale 1, esto es, 
el valor por defecto, entonces multiplicamos por la matriz Mcod (linea 47), mien- 
tras que si vale cualquier otra cosa, entonces multiplicamos por la matriz inversa 
Mdecod (linea 49). Ambas matrices han sido definidas al principio (lineas 11 y 
12). Por ultimo, la funcion redimensiona la matriz resultante para dar una lista. 

Para finalizar, la funcion desustit (linea 35) realiza el proceso inverso a 
sustitucion: dada una lista de numeros, usa el diccionario diccion (definido en 
la linea 9) para restablecer el texto. En este caso, la funcion es mas sencilla pues 
no hay que hacer comprobaciones. Solo sehalar que puesto que los elementos 
de la lista ahora son numeros, hemos de usar la funcion str (linea 38) para 
convertirlos en cadenas de caracteres y asi puedan ser identificadas como parte 
del diccionario. 

El codigo anterior puede ser probado desde fuera del interprete, pues hemos 

4 Python entiende las cadenas de texto como una especie de arreglo en el que sus caracteres 
se pueden recorrer uno a uno. 

5 Invitamos al lector a modificar el codigo para permitir otros caracteres (ejercicio 27). 
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anadido las lfneas necesarias para proceder a la codification y decodificacion de 
un mensaje introducido por teclado. Para ello, en la lfnea 56 se solicita la entrada 
por teclado del mensaje nrediante la funcion raw_input(), que se almacena en 
la variable texto. A continuation se sustituye y encripta el mensaje (lfnea 57), 
y luego se imprime para mostrar como queda. Finalmente, en la lfnea 61 el 
mismo mensaje es descodificado y deshecha la sustitucion de numeros por letras, 
imprimiendose este. Observese como en la llamada a la funcion crypt usamos 
un segundo argumento para indicar la codification inversa. 


Si guardamos el codigo anterior en un fichero con nombre cripto.py, la 
ejecucion del codigo desde una consola serfa esta: 


$ python cripto.py 








teorema 

fundamental 

del 

algebra 






Este es 

el mensaje 

a enviar: 






[115, 68, 157, 102, 

60 , 

139, 160, 97, 

195 , 

126 , 

72, 

166 , 

82 , 

50 , 

101, 136, 79, 172, 176, 104, 

220 , 

154 , 

97, 

199 , 

83 , 

51 , 

103, 77, 49 

103 

, 2, 1, 3] 






Este es 

el mensaje 

descc 

dificado : 






teorema 

fundamental 

del 

algebra 







donde la lfnea 2 es la que hemos introducido por teclado. 

mm - 

EJERCICIOS 


Ejercicios de repaso 

|3| Decidir cuales de las siguientes aplicaciones son lineales: 

(a) Mb : Al 2 x 2 (R) —> Al 2 xi(®) dada por Mb(A) = AB con B = 

(b) N b ■ A^ 2 x 2 (®) —t -Ad2x2(®0 dada por N B (A) = AB — BA con 




(c) C:M n (R)-+S donde C(A) = \{A + A T ) y 

5 = {le A1„(K) :A = A t } 


13 Escribir las matrices de las siguientes aplicaciones lineales respecto de las 
bases canonicas de los espacios correspondientes: 
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(a) f(x!,x 2 , x 3 ) = ( x 1 + x 2 , 2 xi - x 3 ) 

(b) f(xi,x 2 , x 3 ) = (a,’i - x 2 , x 2 + 2a: 3 ,2xi - 3x 3 ) 

(c) f{x i, x 2 , x 3 ) = 3xi - x 2 + x 3 

|2I Dar una base para A4 3X 2(B0 y hallar la rnatriz asociada a la aplicacion 
lineal T (aplicacion traza) definida como T : A4 3X 2(R) —t R tal que T(A) = 
tr(A), con respecto a esta base. 

Nota: la traza de una matriz se definio en el ejercicio 22 del tema 4. 

IX] Sea T : Pj|[x] — > Pr[x] lineal tal que T( 1) = x 2 +l, T(x) = —x, T(x 2 ) = x 3 
y T(x 3 ) = x 2 + x — 1. Hallar la matriz asociada a T con respecto a la base 
canonica. 

|2] Se consideran las aplicaciones lineales /, /' : R 3 —> K 2 y g, g' : K 2 —> K 3 
cuyas matrices respecto de las bases canonicas, son: 



Se pide: 

(a) Hallar las matrices respecto de las bases canonicas de: 

(/ + /')°?; + f°(g + g'); g° (/ + /'); 

g'° (/ + /); (g + g')°f; (g + g’) ° (/ + /'); (/ + /') ° (g + g')- 

(b) Averiguar cuales de las anteriores aplicaciones son inyectivos, cuales so- 
breyectivos y cuales isomorfismos. 

121 Demostrar que las aplicaciones / : R 2 —>• K 2 dada por f{x,y) = 
(x + y, x + 2 y) y g : R 2 —>• K 2 dada por g(x, y) = (2x — y, —x + y) son inversas 
una de la otra. 

I an Sea la aplicacion lineal T : R 3 —>• K 3 definida por 

T(x, y,z) = (x + 2y + z,3x + y + 2z, 3x + 2y + 2 z) 

Probar que es invertible y hallar la matriz asociada a T~ 1 . 

I3i:i Sea / el endomorfismo de R 3 cuya matriz en la base B = {ui, U 2 , u 3 } es 
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Hallar la matriz del endomorfismo en la base B' = {vi,V 2 ,V 3 } siendo 


vi=ui, v 2 = -u 2 + ui, v 3 = 2ui - u 2 + |u 3 


latil Sea V un espacio vectorial de dimension 3 y B = (u-|. u 2 . u 3 } una base 
de V. Se considera la aplicacion lineal / : V —> V dada por: 

/(ui) =-ui - 2u 2 + 6u 3 ; /(u 2 ) = -m + 3u 2 ; /(u 3 ) = -u 3 - u 2 + 4u 3 

Calcular las ecuaciones de / respecto de las bases B' (en el espacio de partida) 
y B" (en el espacio de llegada), donde: 


B' = { u 2 + u 3 ,u 3 , —Ui - u 2 + 4u 3 } 

B" = { u 2 + u 3 , u 3 , -u : - u 2 + 3 u 3 } 

QQ Dadas las siguientes aplicaciones lineales encontrar una base del nucleo 
y unas ecuaciones implicit as de la imagen comprobando en cada caso la ecuacion 
de dimensiones: 

dim(ker(A)) + dim(Im(H)) = dim(V r ) 

(donde V es el espacio de partida) e indicar si son inyectivas o sobreyectivas: 

(a) A : R 3 —> K 3 definida por A(x, y,z ) = (x + z, y, x + y + z). 

(b) B : C 2 —> C 2 definida por B(z\,Z 2 ) = ( iz\ + z 2 , z\ +iz 2 ). 

(c) D : C 3 —> C 3 con matriz asociada 



Problemas 

[31] Encontrar las matrices de las siguientes aplicaciones lineales: 

(a) Mb y Nb del ejercicio 1. 

(b) A : P^[x] ->• R 3 tal que A(p(x)) = (p(0),p(l),p(2)). 

(c) A : Pr[x] P^[x] tal que A(p(x)) = p(x + 1). 

WW Sea A : 1R 3 —> R 3 dada por A(x, y, z) = (x + y, z,x + z). Encontrar la 
matriz asociada a A con respecto a la base canonica de R 3 . Hallar la imagen 
mediante A de los siguientes subespacios vectoriales: 
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(a) Vi = {(x,y, z) G R 3 : x + y + z = 0}. 

(b) V 2 = {(ar, y, z) G R 3 : (x, y, z ) = t( 1, -1, 1) t G R}. 

WM Sea / un endomorfismo de R 2 tal que /(1, 0) = (2,4) y /(0,1) = (5, —1). 
Hallar la imagen por / del vector (2,3) y la imagen inversa por / del vector 
(0,3). 

|3£] Sea / : R 2 —> R 2 una aplicacion lineal tal que /(1,1) = (0,-1) y 
/(—1, 2) = (3,1). ^Es / invertible? En caso afirmativo calcular / -1 ( 1,1). 

|3£] Respecto de la base canonica de R 3 hallar las matrices de las siguientes 
aplicaciones lineales: 

(a) Simetria con respecto a la recta vectorial {x = 0, y = 0}. 

(b) Simetria con respecto a la recta vectorial (x, y, z) = t(l, 1,1). 

(c) Simetria con respecto al piano vectorial x = y. 

(d) Giro de a radianes con respecto al eje OZ. 

(e) Giro de 90 grados con respecto a la recta {x + y = 0, z = 0} 

(f) Proyeccion sobre el piano vectorial x — y + z = 0. 

QQ Sea T : R 2 —► R 3 la aplicacion lineal definida por 

T(xi, x 2 ) = (xi + 2x 2 , -xi, 0) 

(a) Encontrar la matriz de la aplicacion T en las bases: 

B 1 = {m = (1,3), u 2 = (-2,4)} y 

B 2 = {V! = (1,1,1), v 2 = (2, 2,0), v 3 = (3,0,0)} 

(b) Usar la matriz obtenida en el apartado anterior para calcular T(8,3). 

|3U Sea / : R 3 —> R 3 una aplicacion lineal tal que ker(/) = {x G R 3 : 

2xi +x 2 + x 3 = 0}, Sea u = (1, —1,2) y v = (—2, 2, a). ^Para que valor de a se 

cumple que /(u) = /(v). 

|3£J Sea / : R 4 —> R 3 una aplicacion lineal tal que: 

■ ker(/) = {x G R 4 : 5x’i — x 2 — 5x 3 = 0, 5x 3 + x 2 — 5x4 = 0} 

■ Im (/) = {y G R 3 : yi + y 2 - 2/3 = 0 } 

. /( 1 , 2 , 0 , 1 ) = ( 1 , 1 , 2 ) 

■ Existe A € R tal que /(0,1,2,1) = (A, A + 1, A) 
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Calcular /(3, —1, —3,0). 

latPl Sea V un espacio vectorial de dimension 4 y B = {ui, u 2 , u 3 , u 4 } una 
base de V. Sea / el endomorfismo de V dado por 


/(u^ = u 4 - 3 u 2 + 2u 3 + 2u 4 
/ (u 2 ) = -2 u 2 + u 3 + 3 u 4 


/(u 3 ) = 4ui - 2u 2 + 3u 3 - 7u 4 
/(u 4 ) = 4ui - 6u 2 + 5u 3 - u 4 


Se pide: 

(a) Escribir las ecuaciones de / respecto de la base B, y hallar una base y la 
dimension de ker(/) e Im(/). 

(b) Sea L la variedad lineal generada por los vectores 

u 4 — u 2 © 2u 4 , —3u 4 © 4u 3 © 2u 4 , —3u 4 © 2u 2 © 3u 4 

Calcular una base y unas ecuaciones imph'citas de f(L) respecto de la base 


B. 


|§g{y Dar la dimension y una base del nucleo y la imagen de las siguientes 
aplicaciones lineales, indicando si son inyectivas, sobreyectivas y/o biyectivas: 

(a) Mb y Nb del ejercicio 1. 

(b) A : Pjj[x] — > Pjjj[x] tal que ri(l) = x 2 + 1, A(x) = x + 2, A(x 2 ) =i 3 -iy 
A(x 3 ) = 1. 

(c) La aplicacion derivada de Pjj [x] en [x]. 

(d) La aplicacion traza en A4 2 (R). 

|2£| Sea / el endomorfismo de A4 2 (K) definido por f(X) = A ■ X — X ■ A, 
donde A es la matriz 



Se pide: 

(a) Calcular las ecuaciones de / respecto de la base canonica de A4 2 (K) 

(b) Probar que V = Im(/) © ker(/). 
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Ejercicios teoricos 

l*M Sea / : V —> V un endomorfismo tal que f 2 + / + Id = 0. ^Es / 
invertible? 

* HBH Dada A G C(V) demostrar: 

(a) A 2 = 0 si y solo si Im(Gl) C ker(A). 

(b) ker(A” _1 ) C ker ( A n ), para n > 1. 

(c) Si V = Im(Gl) ® ker(A) entonces Im(Gl) = Ivn(A 2 ). 

|2£] Sea / : V —> V' una aplicacion lineal entre los e.v. V y V' y sea 
{vi,..., v„} una base de V. Probar que: 

(a) / es inyectivo si y solo si {/(vi),..., /(v„)} es l.i. 

(b) / es sobreyectiva si y solo si {/(vi),..., /(v„)} es un sistema de genera- 
dores de V'. 

(c) / es biyectivo si y solo si {/(vi),..., /(v„)} es una base de V’. 

HW<1 Sean / y g dos endomorfismos de un espacio vectorial tales que go f = 0. 
Decidir cuales de las siguientes afirmaciones son ciertas: 

(a) Im(/) C ker(g). 

(b) Im(g) C ker(/). 

(c) ker(/) C Inr(g). 

(d) ker( ff ) C Im(/). 

iaw«l Sea / y g dos endomorfismos de un espacio vectorial tales que 
dim(ker(/)) = 1 y dim(ker(g o /)) = 1. Calcular dim(ker(g)). 

Ejercicios adicionales 

lawi Modificar el codigo de la pagina 218 para que los mensajes puedan llevar 
caracteres mayusculas, numeros y caracteres acentuados. 



A 


6 Diagonalizacion 




En el tema anterior hemos estudiado las matrices asociadas a una aplicacion 
y hemos visto como estas cambian en funcion de la base elegida para represen- 
tarla. El objetivo principal de este tema es tratar de obtener una nratriz que 
represente a un endomorfismo dado, respecto de cierta base, que sea lo mas sen- 
cilia posible. Como veremos, esta representation nos proporcionara information 
interesante sobre el funcionamiento de una aplicacion lineal. 


Para entender mejor este objetivo retomemos (il) del ejemplo 5.8 en el que 
tem'amos un endomorfismo A cuya matriz respecto de cierta base B = {ui, 112 } 
era 



mientras que en la base B' = {vi,V 2 }, con 


Vi = U! + 2u 2 , v 2 = 2ui + 3 u 2 


correspondi'a a 



Es decir, en esta situation tenemos una base respecto de la cual, la apli¬ 
cacion lineal dada tiene asociada una matriz diagonal. Tales matrices tienen 
interesantes ventajas; por una parte porque son faciles de operar (son faciles 
de multiplicar, de invertir, etc.) pero ademas nos proporcionan una mejor com- 
prension de lo que hace la aplicacion. 

Mas concretamente, si prestamos atencion a la aplicacion anterior respecto 
de la base B ', atendiendo a la definition de matriz de una aplicacion respecto 
de una base, observamos que 


A'w 1 = 2vi, A'v2 = 3v 2 

es decir, la imagen de cada uno de los vectores de la base elegida corresponde a 
un multiplo de ellos mismos. Desde el punto de vista geometrico es facil hacerse 
una idea de lo que hace esta aplicacion. En la figura 6.1a vemos una muestra 
de ello. Suponiendo que los vectores Vi y v 2 son los vectores de los ejes, esta 
aplicacion “estira” los vectores en la direction vi hasta el doble de su tamano, y 
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(b) Imagen del vector x 


Figura 6.1: Aplicacion lineal A! 


los de la direction V 2 al triple de su longitud. De modo que un circulo centrado 
en el origen se transformara en un elipse de semiejes 2 y 3. 

En la figura 6.1b vemos con mas detalles como se transforma un vector x 
cualquiera: descomponemos el vector en sus componentes horizontal y vertical, 
y la imagen tendra su componente horizontal multiplicada por 2 y la vertical 
por 3. 

Observese que el hecho de que cada uno de los vectores de la base se 
transforme en un miiltiplo suyo (es decir, esencialmente en el mismo vector) es 
lo que nos ha permitido describir geometricamente la aplicacion. Estos vectores 
especiales son los que tratamos en la siguiente section. 


mm - 

VALORES Y VECTORES PROPIAS 

Los autovalores y autovectores juegan un papel muy importante a la hora de 
entender el comportamiento de los endomorfismos, lo cual se pondra de mani- 
fiesto principalmente en el siguiente tema, en el que su uso sera fundamental. 1 


1 Si bien estos concept os estan asociados a aplicaciones lineales, fueron descubiertos primero 
en el estudio de formas cuadraticas y de ecuaciones diferenciales a traves de los trabajos de 
Euler, Lagrange y Cauchy entre finales del s. XVIII y principios del XIX. Fue el matematico 
aleman David Hilbert, a comienzos del s. XX, quien introdujo por primera vez los terminos 
eigenvalue y eigenvector (autovalor y autovector, respectivamente). 
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Un vector x / 0 se dice vector propio o autovector de un endomorfismo 
/ : V —> V si existe A £ K tal que /(x) = Ax. A A se le llama valor propio o 
autovalor asociado al autovector x. 


Es decir, los autovectores son vectores que se transforman “esencialmente” 
en si mismos (salvo constantes, que son los autovalores). 



(i) Es importante hacer hincapie en que la definition impide que el vector 
nulo sea autovector, sin embargo si es posible que una aplicacion tenga 
como autovalor 0. 

(n) Si consideramos x un autovector de una aplicacion / asociado a cierto 
autovalor A, y L = L(x) es el subespacio que genera dicho vector, entonces 
cualquier otro vector y £ L tambien es autovector asociado al mismo 
autovalor. Es decir, hay infinitos autovectores asociados a un autovalor. 

Esto es facil de comprobar, puesto que si y £ L entonces y es de la forma 
y = ax, para cierto a £ K; luego /(y) = a/(x) = aAx = Ay, pues x es 
autovector. 

Podemos observar que todos los vectores de L permanecen en L. Este es 
el concepto de invarianza que presentamos a continuation. 


Otro concepto fuertemente vinculado a los autovectores y autovalores es el 
de subespacio invariante. 



Sea / : V —> V una aplicacion lineal. Un conjunto L se dice invariante 
respecto de / si f(L) c L. 
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(i) Como hemos comentado en la nota 6.1, si / es la aplicacion lineal cuya 
matriz en la base B = {vi,V 2 } es 



entonces los subespacios L\ = L(v i) y L 2 = i(v 2 ) son invariantes respecto 


de /. 


(il) Dada una matriz de rotation respecto del eje OZ de angulo 9 , cuya matriz 
respecto de la base canonica se escribe 



es facil deducir geometricamente sus invariantes: el piano L\ = { 0:3 = 0 } 
y el eje OZ (L 2 = {%i = x 2 = 0}). 

Comprobemoslo: si x £ L\ =^> x = a(l, 0,0) + /3(0,1,0). Entonces, 

i?x = a(cos9, sen 9,0) + /3(— sen0, cos 9,0) 

= (a cos 9 — P sen 9, a sen 9 + f3 cos 9, 0) £ L\ 

Mientras que si x £ L 2 se observa que Rx. = x. Notese que esta igualdad 
significa que los vectores de L 2 son autovectores asociados al autovalor 1 . 

(in) Si / : V —► V es lineal, los espacios { 0 } y V son trivialmente invariantes 
para dicha aplicacion. 


Los espacios invariantes tienen un especial significado desde un punto de 
vista geometrico que ayuda a describir el comportamiento de una aplicacion. 
Como hemos podido comprobar en el ejemplo anterior, estos espacios estan 
mtimamente relacionados con los vectores propios. De momento probaremos un 
sencillo resultado sobre operaciones con subespacios invariantes. 
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Si Li y L 2 son subespacios invariantes de una aplicacion lineal / entonces 
L\ + L 2 y L\ (~l L 2 tambien son subespacios invariantes. 


Demostracion: 

Veamoslo para la suma. Si x £ Li + L 2 entonces por definition de suma de 
subespacios x = xi + x 2 con xi £ L\ y x 2 £ L 2 . Luego /(x) = /(x 1 ) + /(x 2 ) 
pertenece a L\ + L 2 , pues /(x 1 ) £ Li y /(x 2 ) G i 2 , ya que ambos subespacios 
son invariantes. 

Analogamente se razona para la intersection de subespacios. 


Como comentamos al inicio del tema, el objetivo que perseguimos es el de 
poder representar una aplicacion lineal de la forma mas sencilla posible. En el 
ejemplo que mostramos al inicio hemos podido comprobar que es facil interpretar 
una aplicacion lineal cuando la matriz de esta es diagonal. La siguiente definition 
va en esa lfnea. 



Una aplicacion lineal / : V —> V se dice diagonalizable si existe una base de 
V respecto de la cual la matriz asociada es diagonal. 

Igualmente, se dice que una matriz es diagonalizable si la aplicacion lineal que 
la tiene como matriz asociada es diagonalizable. Esto es, si existe C £ A1 rl (K) 
invertible tal que D = C~ 1 AC , con D una matriz diagonal. 2 


El siguiente resultado nos proporciona una caracterizacion de las aplicaciones 
diagonalizables: 

— ^ - 


Una aplicacion lineal / : V —> V es diagonalizable si y solo si existe una base 
de V formada por autovectores de /. 


Demostracion: 

Probemos en primer lugar la suficiencia. Si B = {ei,...,e„} es una base 

2 Esto ultimo se tiene al realizar un cambio de base, desde la base respecto de la que tenemos 
la matriz de la aplicacion a la base respecto de la cual la aplicacion tiene una matriz asociada 
que es diagonal. Como vimos en el tema anterior, la relacion entre ambas matrices es de la 
forma D = C~ 1 AC. 
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formada por autovectores de /, con autovalores asociados Ai,..., A„, entonces 
por definition, f(ej) = A,e ? . Es decir, las coordenadas respecto de la base B de 
la imagen del vector e, son (0,..., 0, Xj, 0,..., 0). Por tanto, la matriz respecto 
de esta base se escribe 



( 6 . 1 ) 


que es diagonal. 

Veamos ahora la necesidad. Si la matriz respecto de una base B' = 
{vi,..., v„} es diagonal tendra la forma dada en (6.1). Es decir, 


/(vi) = Aivi, ..., /(v„)= A„v„, 


es decir, existe una base formada por autovectores. 

■ 

La pregunta natural que surge es: ^siempre es posible obtener esto? Es decir, 
dada una aplicacion, ^podemos encontrar siempre una base respecto de la cual 
la matriz de dicha aplicacion sea diagonal? Veamos que la respuesta es negativa 
a traves del siguiente ejemplo: 



Consideremos la aplicacion lineal cuya matriz respecto de cierta base sea 



Si existe una base respecto de la cual dicha aplicacion tiene asociada una matriz 
diagonal, entonces, usando las matrices de cambio de base se deberfa tener: 



para cierta matriz invertible C, que podemos escribir como 



Haciendo operaciones, 



J_ d ~b 

\C\ \ —c a 



:: 


a b 
c d 


0 
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Por tanto hemos de resolver el sistema 


(ada — bc/3 ) 

= 1 

(1) 

,^ab(-a - d) 

= 1 

(2) 

\b\ cd ( a ~ I 3 ) 

= 0 

(3) 

yr ( bccx + ad(3 ) 

= 1 

(4) 


Como \C\ ^ 0 (pues C es invertible), de (3) se deduce que: 

(i) O bien c = 0, en cuyo caso de (1) y (2) se tiene j^ada = j^adfl. De aqui, 
si a = 0, (2) no es posible. Si d = 0, (1) no se tendria, y la otra option es 
que a = 13, pero esto contradice nuevamente (2). Por tanto c / 0. 

(n) Si d = 0 se tendria que — j^bc(3 = —j^bca, y un argumento similar al 
anterior nos lleva a contradiction. Luego d 0. 

(ill) La unica posibilidad que resta es que a = /3, que contradice (2). 

En conclusion no puede existir C invertible tal que C~ 1 BC sea diagonal, o 
dicho de otro modo, no toda aplicacion es diagonalizable. 


En lo que sigue trataremos de dar resultados que nos garanticen que una 
aplicacion es diagonalizable, y finalmente veremos como podemos obtener una 
base respecto de la cual, la matriz de una aplicacion sea lo mas sencilla posible 
(aunque no sea diagonal). 



Si ei,... e n son autovectores correspondientes a autovalores Ai,..., X n dis- 
tintos entre si dos a dos, entonces {ey,... ,e n } es un conjunto l.i. 


Demostracion: 

Procederemos por induction en el numero de vectores. Para n = 1 el resultado 
es trivial (recuerdese que un vector no nulo siempre es l.i. y que los autovectores, 
por definition, no pueden ser nulos). 

Supuesto el resultado cierto para n — 1, veamos que tambien es cierto para 
n. Para probar que n vectores son l.i. consideramos una combination lineal 
igualada al vector nulo y trataremos de ver que todos los escalares deben ser 
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iguales a cero: 

«i e i + • • • + a n e n = 0 •£=>■ f(aiei + • • • + a n e n ) = /(0) = 0 

<=> «i/(ei) H-ha„/(e n ) = 0 

O aiAiei + • • • + a n X n e n = 0 (6-2) 

Multiplicando oqei + ■ • • + a n e n = 0 por \ n y restandola de (6.2) se obtiene 
«i(A n — Ai)e! + • • • + a n _ i(A n — A„_i)e„_ 1 = 0 

Esta expresion es una combinacion de los n — 1 primeros vectores igualada 
a cero. Usando la hipotesis de induction, estos vectores son l.i., y por tanto 
los escalares deben ser nulos; pero como ademas A n — A, ^ 0, Vj (pues por 
hipotesis los autovalores son todos distintos), se tendra que a\ = ■ ■ ■ = a n -i = 0. 
Sustituyendo en la combinacion lineal initial se deduce que a n tambien es cero, 
y de aqui se obtiene la independence buscada. 



Como consecuencia de los Teoremas 6.1 y 6.2, si un endomorfismo en un 
espacio de dimension n tiene n autovalores distintos entre si, entonces sera 
diagonalizable. Como veremos mas adelante, el reciproco no es cierto, es decir, 
existen endomorfismos en espacios de dimension n diagonalizables, que no tienen 
n autovalores distintos. 


Bll - 

POLINOMIO CARACTERISTICO 


Veamos ahora como podemos calcular autovectores y autovalores de una 
aplicacion. Sea / : V —> V una aplicacion lineal con matriz asociada A en una 
cierta base. Sabemos que 

/(x) = tix 

Si x es un autovector asociado a un autovalor A, entonces 


/(x) = Ax => Ax = Ax => (A — A/)x = 0 


Denotando por A = {a,j ) y x = (aq,... ,x n ), podemos escribir estas ecua- 
ciones explicitamente como 


(an - A)xi 

+ 

ai 2 x 2 

+ • 

• + 

Q'ln%n 

= 0 

^21^1 

+ 

(a 22 - A)x 2 

+ • 

• + 

O j 2n%n 

O 

II •' 

^nl^l 

+ 

a n 2X2 

+ • 

• + 

(^nn 

= 0 
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obteniendo un sistema homogeneo que debe satisfacer cada uno de los auto- 
vectores asociados al autovalor A. Asi pues, para que existan autovectores, este 
sistema debe tener solucion distinta de la trivial, o equivalentenrente, la matriz 
del sistema debe tener rango menor que n. Esto es, 


an — A 

012 

n 

a 2 l 

022 — A 

n 

^nl 

O ra 2 

®nn 


0<^ \A- A/| =0 



Dada A £ M n (K), la expresion |A — A/| es un polinomio 3 en la variable A 
que se denomina polinomio caracteristico 4 de A. 



Como hemos visto antes, los autovalores de una aplicacion lineal son las 
raices del polinomio caracteristico. Por tanto, si queremos asegurar la existencia 
de autovalores necesitamos que el cuerpo K sea algebraicamente cerrado, es 
decir, debemos trabajar en C, de forma que la ecuacion |A — A/| = 0 tenga n 
soluciones (contando multiplicidades). 


Como hemos visto, el polinomio caracteristico se construye usando la matriz 
de una aplicacion en una base dada. Pero ique ocurre si cambiamos la base? 
El siguiente resultado nos muestra que el polinomio caracteristico no cambia si 
usamos otra base para representar a la matriz de una aplicacion. 



El polinomio caracteristico no depende de la base que representa a la matriz 
de una aplicacion. 


Demostracion: 

Sean Ay A' dos matrices asociadas a la misma aplicacion lineal en las bases B 

3 Se puede probar por induccion que dicha expresion es de hecho un polinomio de grado 
exactamente n. 

4 E1 concepto aparece explfcitamente en un trabajo de Lagrange de 1774 relacionado con 
ecuaciones diferenciales. 
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y B ', respectivamente. Los polinomios caracteristicos seran 
V B {X) = \A-XI\, v b ,(X) = \a'-\i\ 

Sabemos que la relation entre las matrices Ay A' viene dada por A' = C~ 1 AC , 
con C una matriz invertible (la rnatriz del cambio de base). Entonces, 

\A'-XI\ = \C~ X AC-XI\ = \C~ x AC-XC~ x IC\ 

= \C~ X AC-C- 1 (\I)C\ = \C~ 1 {AC - \IC)\ 

= | C~ X {A - \I)C\ = | C- X \\A - XI\\C\ = \A- XI\ 

es decir, ambos polinomios son iguales. 


(i) Consideremos la aplicacion de matriz siguiente: 

'l 2\ 


A = 


.5 4, 


El polinomio caracteristico vendra dado por: 


V A { A) = 


1 - A 2 
5 4 - A 


= (1 - A) (4 - A) - 10 = A 2 - 5A - 6 


Sus raices, esto es, los autovalores de A, son A = — 1 y A = 6. 

Segun comentamos en la nota 6.2 al tener todos los autovalores distintos, 
la aplicacion sera diagonalizable, pues los autovectores asociados deben ser 
l.i., y como estamos en un espacio de dimension dos, estos autovectores 
forman una base. 

Calculemos ahora los autovectores. Debemos resolver la ecuacion tix = Ax 
para cada autovalor obtenido. Esto es, (A — A/)x = 0; 

para A = —1, 


(A + J)x = 0 => 




Notese que este sistema ha de tener soluciones no triviales, pues en 
caso contrario no habria autovectores, lo cual no puede ocurrir pues 
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los autovalores siempre van acompanados de autovectores. Resolviendo 
tenemos que un autovector l.i. asociado a A = —1 es uj = (1, —1). 

para A = 6, 


[A — 6/)x = 0 => 




De igual modo encontramos que un autovector l.i. asociado a A = 6 
es u 2 = (|,1). Observese que en virtud de (il) de la nota 6.1, no hay 
inconveniente en considerar un multiplo de este vector, por ejemplo (2, 5), 
para evitarnos las fracciones. 

De este modo, la base B' = {(1, —1), (2, 5)} esta formada por autovectores, 
y es posible diagonalizar A del siguiente modo: 


(n) Sea Re la matriz de rotation en R 2 que obtuvimos en el ejemplo 5.4: 

'cos 9 — send\ 

,sen 9 cos 9 


Re = 


El polinomio caracteristico es 

cos 9 — A — sen t 


|Re - A/| = 


sen 6 cos 9 — A 


= A 2 — 2Acosa + 1. 


, 2 cos 9±V- sen 2 6 

Sus raices son A = --- = cos 9 ± i sen 9. 

Observamos que hay autovalores reales si y solo si sen0 = 0, es decir 
si 9 = kn, k € Z. En este caso la matriz initial Rk -k es ya diagonal, y 
obviamente diagonalizable. 

Por su parte, cuando sen 9 ^ 0, los autovalores estan en C y son distintos, 
luego es diagonalizable (de forma compleja). Si embargo, si nos restringi- 
mos a R, esta aplicacion no seri'a diagonalizable pues no tiene autovalores 
reales, y por tanto no hay posibilidad de obtener autovectores reales que 
formen una base. 


(ill) Encontrar los valores del parametro a £ R para los que la aplicacion de 
matriz 

' 0 0 0 


A = 


0 a 0 
a 0 0 
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es diagonalizable. 

El polinomio caracteri'stico es 


\A-\I\ 


-A 0 0 

0 a — A 0 
a 0 —A 


A 2 (a - A) 


Los autovalores son A = 0 (doble) y A = a. Notese que la matriz tendn'a 
un autovalor triple si a = 0, y un autovalor doble y otro simple si a ^ 0. 
Veamos cada uno de los casos: 

Si a = 0, es decir A = 0 es un autovalor triple, la matriz de partida ya es 
diagonal. 

Si a 0, A = a es un autovalor simple y A = 0 un autovalor doble. Veamos 
si existe una base formada por autovectores. Para ello calcularemos los 
autovectores asociados a cada autovalor: 

para A = a, 


/-a 0 

I 0 0 

\ a 0 




=> Autovector: (0,1,0) 


para A = 0, 


/o 0 

[ 0 a 
\a 0 





=> Autovector: (0, 0,1) 


Puesto que {(0,1,0), (0,0,1)} no forman una base de R 3 , la matriz no 
puede ser diagonalizable. 5 


En definitiva, para ver si una aplicacion lineal es diagonalizable debemos 
calcular primero sus autovalores. Si estamos en un espacio de dimension n, 
entonces habra n autovalores, contando sus multiplicidades, (vease la nota 6.3). 
Si los n autovalores son distintos, el Teorema 6.2 nos dice que los n autovectores 


5 Notese que no puede haber mas autovectores independientes, pues no tenemos mas 
autovalores. 
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asociados son l.i. y por tanto tendremos una base formada por autovectores que 
nos asegura que la aplicacion es diagonalizable. 

Si por el contrario, alguno de los autovalores tiene multiplicidad mayor 
que uno, tendremos el numero necesario de autovectores para formar una base 
siempre y cuando el numero de autovectores asociados a cada autovalor multiple 
coincida con la multiplicidad del mismo. Esto motiva la siguiente definition: 



Se denomina multiplicidad algebraica de un autovalor a la multiplicidad que 
tiene como raiz del polinomio caracteristico. 

Se denomina multiplicidad geometrica de un autovalor al numero de auto¬ 
vectores independientes asociados. 


Por otro lado, el calculo de autovectores que hemos llevado a cabo en el 
ejemplo anterior se puede realizar de forma mas sistematica a traves de los 
subespacios propios : 



Sea / : V —t V lineal con matriz asociada A respecto de alguna base dada. 
Si A es un autovalor de / se denomina subespacio propio correspondiente a A al 
subconjunto 

i?i (A) = ker(A - XI) 


— ^ - 

Observese que E\{ A) es un subespacio invariante por / (vease la (n) de la 
nota 6.1). 


Usando el Teorema 5.3 y las defmiciones 6.5 y 6.6 se tiene: 

dim(.Ei (A)) = dim(V) — rango(A — A I) = multiplicidad geometrica 
Ademas se verifica el siguiente resultado que relaciona ambas multiplicidades: 
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Para cada autovalor 

1 < multiplicidad geometrica < multiplicidad algebraica 


Demostracion: 

Sea /i un autovalor de multiplicidad algebraica r. La primera desigualdad es 
evidente pues el espacio E\(fi) no puede ser el espacio nulo. Para ver la segunda 
desigualdad supongamos que la multiplicidad geometrica de es h, es decir, 
es un espacio de dimension h, con {u!,...,u/,} una base del mismo. 
Ampliemos la base anterior a una base del espacio total (que suponemos de 
dimension n), y sea A la matriz de la aplicacion en dicha base. Por construction, 
A es de la forma 



pues los primeros h vectores de la base son autovectores. 
Si ahora calculamos el polinomio caracterfstico de A, 


\A - \I n \ 


— A 

A' 

/i — A 


0 

A" - XI n - h 


(n ~ X) h \A" - XI n -h\ 


donde | A" — XI n _h\ es un polinomio de grado n — h. Por tanto /i es una rafz de 
multiplicidad al menos h , es decir r > h. 


Finalmente, damos una condition necesaria y suficiente para garantizar que 
una aplicacion es diagonalizable en terminos de las multiplicidades algebraica y 
geometrica de cada autovalor. 



Una aplicacion lineal es diagonalizable si y solo si tiene n autovalores, 
contando sus multiplicidades, y para cada autovalor, su multiplicidad algebraica 
coincide con su multiplicidad geometrica. 
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Demostracion: 

Supongamos que la aplicacion / es diagonalizable. En tal caso existira una base 
B respecto de la cual la matriz de la aplicacion sera diagonal, es decir, 


MbU) = 



0 

A2 

0 



Es claro que el polinomio caracteristico de esta matriz es 


i=l 


luego / tiene n autovalores. 

Si A i es un autovalor simple, es evidente a partir de la Proposition 6.2 que 
su multiplicidad algebraica coincide con la geometrica. Si por el contrario A j 
es un autovalor de multiplicidad r (es decir, aparecera r veces en la diagonal 
de Mg(/), pongamos que en las columnas j\ ,... ,j r ) entonces el espacio E 1 (Xj) 
tiene al menos r vectores independientes, pues 

/( u iJ = A 7 u 7l , ..., /(u Jr ) = Aju jr 

con los Uj. vectores de B. Por otro lado, como la dimension de ese espacio no pue- 
de sobrepasar la multiplicidad algebraica del autovalor (por la Proposition 6.2) 
se tendra la igualdad entre multiplicidad algebraica y geometrica. 

Reci'procamente, si para cada autovalor coincide su multiplicidad algebraica 
y geometrica significa que la surna directa de los espacios 

-Ei(Ai) © • • • © Ei(Afc) 

tiene dimension ri H-+ r*, = n (notese que la intersection de cualesquiera de 

estos subespacios es el vector nulo en virtud del Teorema 6.2), luego dicha suma 
directa coincide con el espacio total. Es facil probar que en tal situation la union 
de las bases de estos subespacios es una base del espacio suma, y por tanto estara 
formada por autovectores. Por el Teorema 6.1, la aplicacion es diagonalizable. 

■ 

A partir de este resultado, identificar si una aplicacion es o no diagonalizable 
resulta sencillo: basta calcular los autovalores y sus multiplicidades algebraicas 
(lo que se obtiene al resolver las raices del polinomio caracteristico) y geometrica 
(que consiste en estudiar la dimension de los subespacios propios, que en ultima 
instancia no es mas que el calculo de rangos). 

Analicemos en el siguiente ejemplo, que sucede en el caso de matrices de 
orden dos. 
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Consideremos A £ A^ 2 (C) la matriz de una aplicacion / : V —> V, con 
dim V = 2. Veamos cuando estas aplicaciones son diagonalizables. 

El polinomio caracteri'stico de A sera Va{X) = (A — Ai)(A — A 2 ), con Ai y A 2 
autovalores en C. En tal caso se puede tener: 

Ai 7 ^ A 2 . Para esta situation ya hemos visto que los autovectores correspondien- 
tes a cada autovalor son l.i., por lo que tendremos una base formada por 
autovectores. El Teorema 6.1 asegura que la aplicacion es diagonalizable. 
La matriz de la aplicacion en la base de autovectores es 

Ai 0 
0 A 2 

Ai = A 2 . Denotamos por A = Ai = A 2 . Se dan dos situaciones: 

(a) dim(ker(A — XI)) = 2 (es decir, rango(ti — XI) = 0). Esto significa 
que el numero de autovectores l.i. asociados al autovalor existente es 
dos, por lo que tenemos una base formada por autovectores, y por 
tanto A es diagonalizable. De hecho, si rango(A — XI) = 0 es que la 
matriz es diagonal, con A en la diagonal. 

(b) dim(ker(A — XI)) = 1 (es decir, rango(A — XI) = 1). En este caso, el 
numero de autovectores independientes asociado al unico autovalor 
es insuficiente para obtener una base de V, y por tanto A no es 
diagonalizable. 


Para matrices de orden tres, las posibilidades son mas numerosas, por lo que 
veremos que sucede en algunos ejemplos concretos. 


Estudiemos si la siguiente matriz es o no diagonalizable: 

1 0 o N 


1 0 -1 

1 -1 0 


Polinomio caracteri'stico: 


|AL-AI| = 


1 - A 
1 
1 


0 0 
-A -1 
-1 -A 


= (1-A)(A 2 -1) 
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Por tanto sus autovalores son: A = 1 (doble), A = — 1 (simple). 
Estudiemos los subespacios propios asociados a cada autovalor: 
Para A = —1, 



dim(E 1 (—1)) = 3 — rango(Al + 1) = 1 y una base de Ei(— 1) esta formada por 
el autovector Ui = (0,1,1). 

Para A = 1, 



dim(Ei(l)) = 3 — rango(Al — I) = 2 y una base de Ei{l) esta formada por los 
autovectores u 2 = (1, 1 , 0 ) y u 3 = (1,0,1 ). 

Notese que tenemos dos autovectores independientes asociados al autovalor 1 
de multiplicidad dos, y un autovector asociado al autovalor — 1 de niultiplicidad 
uno (que es independiente con los otros dos debido al Teorema 6.2) luego 
tenemos una base de autovectores y por tanto la matriz A es diagonalizable. 

Si expresamos la matriz de esta aplicacion en la base formada por los 
autovectores, esto es 


B= {( 0 , 1 , 1 ), ( 1 , 1 , 0 ), ( 1 , 0 , 1 )} 


obtenemos la matriz 



de modo que Ja = P 1 AP 1 donde P corresponde a la matriz de cambio de base 
de B a la base canonica, es decir 



denominada comunmente matriz de paso. 

Por ultimo notese tambien que Ei(l) © E\{— 1) = V. 
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Estudiar si la siguiente matriz es o no diagonalizable: 


A = 



3 

-1 

-1 



Comenzamos calculando el polinomio caracteristico, 



-A 

3 

1 

= 

2 

-1 - A 


-1 


—2 

-1 

-1 

-A 

o 

II 1 
cr 

-A 

2 

3 

-1-A 

—2 

A 

= ( 


0 

-2 - A 

0 



F 3 +F 2 

-A 

3 

1 

= 

2 

-1-A 

-1 


0 

1 

CM 

1 

-2-A 


= (A + 2)(—A 2 + 4) 


Autovalores: A = 2 (simple), A = — 2 (doble). Calculamos los subespacios propios 
asociados a cada autovalor (y con ello la multiplicidad geometrica). 

Para A = 2: 



dim(A 1 (2)) = 3 — rango(A— 21) = 1, y resolviendo el sistema anterior obtenenros 
una base de E±(2) formada por el autovector ui = (—1, —1,1). 

Para A = —2: 


( 2 

E\{—2) = ker(A + 21) => I 2 

v - 2 


3 

1 

-1 



Nuevamente dim(^i(—2)) = 3 — rango(A + 21) = 1. Resolviendo el sistema 
anterior obtenenros una base de Ei(—2) formada por el vector (1, —1,1). 

De aqui podemos deducir que la matriz A no es diagonalizable, puesto que 
el numero de autovectores independientes que proporciona este autovalor es 
insuficiente para formar una base junto con U|. Observese que en este caso, 
E^) ® E^-2) ^ V 
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mm - 

FORMA CANONICA DE JORDAN 

En la section anterior hemos visto las condiciones que aseguran que una 
aplicacion es diagonalizable, pero como vimos en el ejemplo 6.2, tal proceso no 
siempre es posible. Puesto que el interes de la diagonalizacion reside en la posibi- 
lidad de trabajar con matrices de aplicaciones que sean lo mas sencillas posibles 
(esto es, matrices diagonales), de forma natural podemos preguntarnos cual es 
la matriz mas sencilla asociada a una aplicacion que no sea diagonalizable. Tal 
matriz se denomina forma canonica de Jordan . 6 

Comencemos viendo la situation en el caso de matrices de orden dos no 
diagonalizables. Recordemos que en el ejemplo 6.4, si los autovalores de una 
matriz A £ A42(C) son iguales y rango(A — XI) = 1 sabemos que la matriz no 
es diagonalizable. En este caso se tiene el siguiente resultado: 



Si A £ A^QK) y tiene sus dos autovalores iguales entonces la matriz 
(A — XI) 2 = 0, donde A es el unico autovalor de A. 


Demostracion: 

Veamos que {A — A/) 2 x = 0, Vx £ V, por lo que (A — XI) 2 sera la aplicacion 
nula, y por tanto {A — XI) 2 = 0. 

En primer lugar, si x £ E\{X) obviamente {A — X J)x = 0, de modo que 
trivialmente {A — A/) 2 x = 0. Supongamos entonces que x ^ -Ei(A), y sea v un 
autovector asociado a A. Es evidente entonces que x y v conforman una base 
de V (pues V tiene dimension dos, y ambos son independientes). Consideremos 
ahora 

w = (A — A/)x £ V (6.3) 

Como {x, v} es una base podemos escribir w = ax + /3v. Vamos a probar 
que a = 0. Una vez probado esto, entonces ocurrira que w £ -Ei(A) (pues es un 
multiplo de v), de modo que 

0 = {A — A/)w = (A — A/) 2 x 
como queriamos demostrar. 

Veamos entonces que a = 0, procediendo por reduction al absurdo. De (6.3) 
se tiene que {A — A/)x = ax + /3v, y operando llegamos a 

(A — (A + a)/)x = /3v 

6 Aparece en 1870 en el trabajo del matematico frances Camille Jordan titulado Traite des 
substitutions et des equations algebriques. 
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Suponiendo que a / 0, como el linico autovalor de A es A, entonces la matriz 
B = A — (A + a)I tiene determinants no nulo, es decir, es no singular y por 
tanto podemos escribir 


x = B~ 1 f3v 


(6.4) 


Multiplicando por A esta ultima expresion, y teniendo en cuenta que los escalares 
conmutan con la multiplication de matrices, 


Ax = X/3B 1 v = f3B 1 Av = (3B l Av 


donde la ultima igualdad se debe a que v es un autovector de A asociado a A. 
Pero ademas, A = B + (A + a)I , de modo que lo anterior es: 


A x = (3B X (B + (A + a)I)v = /3v + (A + a)/3B x v 


Usando (6.4) se llega a que 


Ax = (3v + Ax + ax => /3v + ax = 0 


Esto es una combination lineal de dos vectores que son independientes, igualados 
al vector nulo, es decir, a = /3 = 0, que contradice nuestra suposicion de que 
a/0. Asi concluye la demostracion. 

■ 

Volvamos a la situation anterior. Denotemos por Ed (A) = ker(A — XI). En el 
caso que nos ocupa Ei(X) es un espacio de dimension uno, y como estamos en un 
espacio V de dimension dos, podemos encontrar un vector no nulo 112 £ V\E. 
Sea ahora uj = (A — A/)u 2 . Entonces U! G E 1 ( A) pues 

(A — A/)ui = (A — A I)(A — A/)u 2 = 0 (por el Lema 6.3). 

Por tanto Ui es un autovector asociado al autovalor A, luego Aui = Aui. Por 
otra parte, 


U! = (A — A/)u 2 => Au 2 = ur + Au 2 . 


Consideremos ahora la base {ui, u 2 } (se trata de una base pues Ui £ Ed (A) 
y u 2 G V\Ei(X)). La matriz de la aplicacion en esta base resulta: 



Esta es la forma canonica de Jordan de la matriz A. 
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Encontrar la forma canonica de Jordan de 


A = 



El polinomio caracterfstico es 




-A 2 
-2 4 - A 


(A — 2) 2 


con autovalores A = 2 (doble). 

Construimos E 1 (2) = ker(A — 21), que tiene dimension 1, de manera que A 
no puede ser diagonalizable. Para obtener la forma de Jordan calculamos una 
base de Ei(2), que estara formada por un unico vector, p.e. (1,1)- Como este 
espacio resulta insuficiente para conseguir vectores de una base, consideramos 
el espacio 


E 2 (2) = ker((A — 2I) 2 ) 


Del Lema 6.3 sabemos que (A — 2 I) 2 = 0, luego E 2 ( 2) = R 2 , y entonces 
podemos escoger un vector de R 2 \-Ei( 2), por ejemplo u 2 = (1,0) (cualquier 
vector independiente con el anterior nos vale). 

Ahora consideramos 



Notese que ui S Ei(2). Finalmente, consideramos la base {(—2, —2), (1,0)} 
(jatencion al orden!) y por tanto la aplicacion A tiene como matriz asociada en 
esta base 



La matriz de cambio de base sera 



y se verifica Ja = P X AP. 
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(i) (continuation del ejemplo 6.6) 
Vimos que la matriz 



tiene autovalores A = 2 (simple) y A = — 2 (doble) y subespacios propios 
£ 1 (2) = L((-l,-l,l))y£ 1 (-2) = L((l,-l,l)) 

Sabiamos que la matriz A no es diagonalizable porque el nurnero de auto- 
vectores independientes que proporciona el autovalor doble es insuficiente 
para formal - una base junto con el autovector asociado al autovalor simple. 

Tambien se observa que Ei(2) + E 1 (—2) ^ V, es decir, existe un “aguje- 
ro” entre los espacios de autovectores y el espacio total. Esta diferencia 
es debida a que el autovalor A = —2 de nmltiplicidad algebraica 2 no ge¬ 
nera un espacio de autovectores de suficiente dimension (su nmltiplicidad 
geometrica es 1). Por ello consideramos ahora E 2 (— 2) = ker((A + 2J) 2 ); 
para ello calculamos 


(A + 2J) 2 = 





Se tiene que dim£’ 2 (—2) = 3—rango((A+2/) 2 ) = 2 y una base se obtendra 
resolviendo el correspondiente sistema. En este caso, 


Base de E 2 (- 2) = {(-1,1,0), (0,0,1)} 

Es importante observar que E\{— 2) C E 2 {— 2), como se comprueba facil- 
mente, ya que la base de Ei(— 2) esta en E 2 {— 2). Como el segundo espacio 
es mas grande podemos tomar u 3 G E 2 {— 2)\£ , 1 (—2). Por ejemplo, noso- 
tros escogemos u 3 = (0,0,1). 

A continuation calculamos u 2 del siguiente modo: 
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Notese ahora que u 2 G E\{—2), es decir es un autovector asociado a 
A = —2 y por tanto satisface tiu 2 = — 2u 2 . Por otra parte, esta claro 
por construction que tiu 3 = u 2 — 2 u 3 . 

Por consiguiente, en la base {u 1 ; u 2 ,u 3 }, la aplicacion dada tiene por 
matriz 



y la matriz de cambio de base es 



(II) 


-2 1 -1 

4=1—1 -1 0 

0 1 -3 


Polinomio caracterfstico: 


4—AJ = 

-2-A 1 -1 

-1 —1 — A 0 

C 2 +C 3 

-2-A 0 -1 

-1 —1 — A 0 


0 1 -3- A 


0 -2-A -3-A 


C 2 -(1+A)Ci 


-2-A (—2 — A)(—1 — A) -1 
-10 0 
0 -2-A -3-A 


= (—2 — A) 


—1 — A -1 

1 -3- A 


= —(A + 2) a 


Autovalores A = —2 (triple). Para calcular los autovectores asociados al 
unico autovalor procedemos corno antes: 
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dim(iJi(—2)) = 3 —rango(A + 2J) = 1 y una base de E\{—1) esta formada 
por el autovector (1,1,1). Notese que como ya no hay mas autovectores 
independientes con este, la matriz A no puede ser diagonalizable; una vez 
mas, la multiplicidad algebraica y la geometrica no coinciden. 

Procedemos como antes calculando el espacio E 2 {— 2) = ker((A + 2 1) 2 ): 

/ o i -A / o i -A /-i o A 

(.A + 2I) 2 = (-11 0 ) ( -1 1 0 ) = ( -1 0 1 ) 

y o i -iJ \ o i -i J y-i o l J 

dim(i? 2 (—2)) = 3 — rango((A + 2 1) 2 ) = 2 y una base de E 2 (—2) obtenida 
al resolver el sistema con matriz anterior es la formada por (0,1, 0) y 
(1,0,1). Observese que Ei(— 2) C E 2 (— 2). Al igual que antes podremos 
coger un vector de E 2 (—2) que no este en E\{— 2), pero uno solo, pues 
la dimension de E 2 {—2) no permite mas. Lo que hacemos en este caso 
es seguir ampliando el espacio con E 3 (—2) = ker((A + 2 1) 3 ). Un simple 
calculo nos muestra que (A + 2 1) 3 = 0. Es decir, E^{—2) = V. Tenemos 
por tanto la inclusion de espacios siguiente 

E\{—2) C E 2 {- 2) C E 3 (-2) = V 

Para construir la forma canonica de Jordan y la matriz de paso corres- 
pondiente consideramos un vector del espacio mayor que no pertenezca al 
espacio inmediatamente inferior, esto es, u 3 e £’ 3 (— 2)\E 2 {— 2), por ejem- 
plo, u 3 = (1,0,0). Sean ahora u 2 = {A + 2/)u 3 y u x = (A + 2/)u 2 , es 
decir, 



Por construccion, el vector u 2 £ E 2 (— 2) mientras que u 3 £ Ei(—2), es 
decir, es un autovector. Luego 

Aui = —2ui, Au 2 = ui - 2u 2 , Au 3 = u 2 - 2u 3 


Si escribimos la aplicacion en la base {u l7 u 2 , u 3 } obtenemos la forma de 
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m 



Jordan y la matriz de paso siguientes: 

(~ 2 1 "A f - 1 

Ja = I 0-2 1 , P = -1 

\0 0-2 / \-1 


A = 


Polinomio caracteri'stico: 

-2-A 0 1 

\A — XI\ = 0 —1 — A 0 

-1 0 -A 

Autovalores A = — 1 (triple). Calculo de autovectores: 

/-I 0 A Ai 

£i(-l) =ker(A + I) => I 0 0 0 I ( cc 2 

\-l 0 lj \x 3 

dim(£li(—2)) = 3 — rango(A +1) = 2 y una base de E\{— 1) esta formada 
por los autovectores (0,1,0) y (1,0,1). Nuevamente el numero de auto¬ 
vectores independientes es insuficiente para formar una base y por tanto 
la matriz A no es diagonalizable. 

Como necesitamos mas vectores, los buscamos en el espacio E 2 (— 1): 


— (—1 — A)(A(2 + A) + 1) — — (A + l) 3 




{A +1) 2 = 


luego E 2 (— 1) = V. Tenemos ahora la cadena de subespacios 

E^-2) C E 2 {-2) = V 

Tomamos un vector u 3 S E 2 (—l)\Ei(— 1), por ejemplo u 3 = (1,0,0), y 
calculamos u 2 = (A + I) u 3 : 


e -Bi(-i) 
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luego u 2 es un autovector. Como en el espacio E\{— 1) tenemos dos 
autovectores independientes tomamos Ux £ Ei(— 1), independiente con 
este ultimo, por ejemplo, Ui = (0,1,0). 

La forma de Jordan y la correspondiente matriz de paso son: 



En los ejemplos anteriores hernos visto como tratar el caso de matrices no 
diagonalizables de dimension dos y tres. A continuation vamos a sistematizar el 
metodo para matrices de cualquier orden. 



Dos matrices A y B se dicen equivalentes si existe una matriz invertible P 
tal que B = P~ 1 AP. 


En particular, las matrices de un endomorfismo en diferentes bases son 
equivalentes. 



Se denomina matriz elemental de Jordan de orden k (o caja de orden k) y 
autovalor A £ C a la matriz Jfc(A) £ Adfc(C) con elementos nulos excepto en la 
diagonal (donde aparece A) y encima de la misma (en la que aparecen 1). 


Algunas cajas elementales de Jordan son 



Ji( A) = (A), J 2 ( A) 


A 1 
0 A 


A 


1 

A 

0 


0 
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Se denomina matriz de Jordan a cualquier matriz cuadrada formada por 
yuxtaposicion de matrices elementales de Jordan a lo largo de su diagonal, es 
decir, una matriz diagonal por cajas en la que cada caja es una matriz elemental. 


J = 


/ JkA Ai) 



Jk 2 {^2) 


Jk n (An) 


Por ejemplo, las siguientes son matrices de Jordan formadas “pegando” cajas 
de diversos tamanos y/o autovalores: 


/ 3 

1 

0 

ON 

0 

3 

0 

0 

0 

0 

3 

0 

\0 

0 

0 

V 


averiguar la razon? 




1 

0 

0 



/ 5 

0 

0 

0 

0^ 

0 

5 

1 

0 

0 


0 

5 

1 

0 

0 

0 

0 

5 

1 

0 


0 

0 

5 

1 

0 

0 

0 

0 

5 

0 

_ 


0 

0 

0 

5 

0 

V^~ 

0 

0 

0 

\y 


\0 

0 

0 

0 

V 

trices no son matrices 

de Jordan; 

^puedc 


1 

0 

0 



( 5 

1 

0 

0 

l\ 

0 

5 

1 

0 

0 


0 

5 

1 

0 

0 

0 

0 

5 

0 

0 


0 

0 

5 

0 

0 

0 

0 

0 

0 

1 


0 

0 

0 

5 

1 

v° 

0 

0 

0 

V 


1° 

0 

0 

0 

V 


Teorema 6.5 (Teorema de Jordan (forma compleja)) 


Toda matriz A £ A4 n (C) es equivalente a una matriz de Jordan J £ Af„(C) 
que es unica, salvo permutacion de las cajas que la forman. 


La prueba del Teorema de Jordan esta basada en el siguiente resultado 
sobre los subespacios Ej( A) = ker((A — A/) J ), denominados subespacios propios 
generalizados. 
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Sea A un autovalor de A de multiplicidad r y consideremos los subespacios 
Ej( A), j > 0. Entonces: 

(i) Ej( A) es una sucesion estrictamente creciente de subespacios de manera 
que existe t tal que E t { A) = E t+I t(A), Vfc > 0; esto es, 


{0} = E 0 (X) C E 1 (X) C E 2 { A) C • • • C E t {X) = E t+ i(A) 


A E t (X) se le denomina subespacio maximo asociado al autovalor A 
(il) E t (X) es un subespacio invariante. 

(hi) u e Ej(X) si y solo si (A — A/)u e Ej_ 1 (X). 

(iv) Se verifica que dim(E t (A)) = r 

Ademas, si Ai,..., A*, son los autovalores de A de multiplicidades respectivas 
ri,... ,rk, con n = rq + • • • + r*,, y E t (A j), j = 1 ,... ,k son los subespacios 
maximos asociados a cada autovalor, entonces 


V — E tl (Ai) © • • ■ © E tk (Afc) 


(6.5) 


donde V es el espacio ambiente. 


Demostracion: 

La demostracion completa de este resultado precisa herramientas que no hemos 
contemplado en este texto, por lo que solo probaremos (i)—(ill). 

(i) Que la sucesion de espacios Ej{ A) es creciente es sencillo de probar, pues 
si v S Ej(X), eso significa que 

(A - A I) j v = 0 => (A - XI)(A - XI) J v = {A- A/)0 = 0 

es decir, (A — A/) J+1 v = 0, lo que significa que v € Ej + 1 (X). 

Por otra parte, si E t ( A) = E t+ i(A), entonces es facil ver que E t ( A) = 
E t+k ( A), Vfc > 0. En efecto, si v € E t+2 , entonces 


0 = (A - A/) t+2 v = (A - A/) t+1 (A - AJ)v 
de modo que (A — A/)v S E t +i(X) = E t ( A), lo que significa que 


(A - A lY((A - A/)v) = 0 => (A - A/) t+1 v = 0 

de donde concluimos que v = E t + i(A), y de aquf E t+2 (A) C £’ t+ i(A). La 
inclusion contraria ya la hemos probado al ver que los subespacios son 
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crecientes; es decir, E t+ i(A) = E t + 2 (A). El mismo razonamiento se usa 
para probar las igualdades siguientes. 

Finalmente, debe existir t tal que E t ( A) = E t+ i(A) pues tenemos una 
sucesion creciente de subespacios vectoriales dentro de un espacio de 
dimension finita, por lo que no puede crecer indefinidamente. 

Como consecuencia notese que las dimensiones de los subespacios propios 
generalizados conforman una sucesion estrictamente creciente liasta que 
se vuelve constante una vez llegado al subespacio maxirno. 

( 11 ) Veamos que si u G E t {\) entonces Au tambien pertenece a dicho conjunto. 
Esto es debido a 

(A — A/) 4 (Au) = (^4 — \iy\A\x — Au + Au) = (Al — A/) t ((A — A/)u + Au) 
= (A - A/) t+1 u + A (A - AJ)*u = 0 + AO = 0 

(ill) Esta claro que u € Ej(X) si y solo si 

0 = (A - XI) J u = (A - XI) j ~ 1 ((A - A/)u) 
es decir, si ( A — A/)u G Ej- i(A). 


Construccion de la forma compleja de Jordan y de una matriz de paso 

Dada una matriz A G AJ n (C), para construir la matriz de Jordan seguiremos 
los siguientes pasos: 

(a) Calcular los autovalores de A, Ai,...,Afc junto con sus multiplicidades 

algebraicas ri,..., tv Puesto que estamos en C sabemos que rH-hr^ = 

n. 

(b) Para cada autovalor A de multiplicidad r construimos los espacios Ej (A) = 
ker((v4—AJ)- 7 ), con j > 0 liasta llegar al subespacio maxirno, es decir, aquel 
que verifica que dim(E t (A)) = r. Denotaremos por 

qj =dim(Ej(X)), j = 0,...,t (6.6) 

(c) Construimos la denominada partition de multiplicidad del autovalor A. 
Para ello, dados los qj calculados en (6.6), definimos 

Pj = Qj~Qj-i, J = 1, — »* 

Observese que qj es una sucesion estrictamente creciente de numeros natu- 
rales, mientras que pj es una sucesion decreciente. Se define la particion 
de multiplicidad del autovalor A como la expresion 


r = p 1 H- Vpt 
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(d) Construida la particion de multiplicidad, la forma canonica de Jordan 
tiene, para cada autovalor: 


Pt 

cajas de tamano 

t 

Pt -1 - Pt 


t- 1 

i 

& 

\ 

(M 

1 

?? 

t -2 

Pi ~P2 


1 


(6.7) 



La forma canonica de Jordan solo depende de la particion de multiplicidad 
de cada uno de sus autovalores. 


Para construir la matriz de paso procedemos como sigue: 


(a) Consideramos (a nuestra election) p t vectores de E t (X)\E t -i(X ) lineal- 
mente independientes entre si, que denotaremos por u*,..., u* t 

(b) Para cada uno de los vectores anteriores construimos 

ii*" 1 = (ti-A/) u (, l = l,...,p t (6.8) 

y los completamos con vectores de E t -i(X)\E t - 2 (X) linealmente indepen¬ 
dientes hasta obtener un total de p t -\ vectores. Ahora en este nivel tene- 
mos 


{ Ul ,...,u p( } C E t ( A), { Ul 


t -1 


U 


‘- 1 ui - 1 


pt 




> • • • > u p t -i-pi} C Et.-i(X) 


(c) Repetimos la operation del paso anterior sobre el conjunto de vectores de 
E t _ i(A), es decir, aplicamos (A—XI) a cada uno de los vectores anteriores y 
los completamos con vectores independientes de E t - 2 \Et ~3 hasta obtener 
Pt- 2 vectores. 

Podemos usar la siguiente representation grafica de la construction de la 
base: 


Pt 

Et( X) 

u i • • • u p t 

Pt- 1 

Et-i(X) 

U 1 1 ••• UpT 1 <7+1 ••• u p7-i-p* 




Pi 

-El (A) 

••• u p t <+1 ••• u p t -l-p t ••• 


(6.9) 
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En cada una de las filas correspondiente a un subespacio Ej( A) de- 
bemos tener exactamente pj vectores linealmente independien- 
tes. Conocidos los vectores del espacio Ej( A), construimos los vectores 
de Ej_ i(A) multiplicando cada uno de cllos por (A — XI). Si el numero 
de vectores asi obtenido es inferior a p^-i, anadimos vectores linealmente 
independientes de Ej_i(A)\.Ej_ 2 (A) en numero necesario hasta obtener 
Pj-i vectores. 

Finalmente, los vectores que formaran parte de la matriz de paso son los 
vectores de cada uno de los subespacios anteriores escritos por columnas 
de abajo hacia arriba (jatencion al orden!'), es decir 


{ui, uf, • ■ ■, uf, u£,..., u|,..., u* ..., u* , ui 


■pt + 1> ‘ ‘ ' U pt + 1’ U Pt+ 2) 


...} 

( 6 . 10 ) 



La tabla anterior tambien nos proporciona de forma grafica el numero y el 
tamano de las cajas elementales de Jordan que aporta cada autovalor. Hemos de 
considerar tantas cajas como columnas de vectores tenemos en la tabla, y cada 
caja tendra un tamano igual al numero de vectores que hay en cada columna. 


Demostracion: (Teorema de Jordan) 

Para demostrar finalmente el resultado central probaremos dos cosas: 

(i) Si A es un autovalor del endomorfismo A, los vectores obtenidos en (6.10) 
forman una base de E t (X), siendo E t ( A) el subespacio maxirno asociado 
a A. Ademas, la restriction de A al subespacio E t ( A) tiene como matriz 
asociada una matriz de Jordan, cuyas cajas corresponden a (6.7). 

(n) Si V = All ® • • • © M r , con Mi subespacios invariantes por A, y Aj son las 
matrices de la aplicacion A restringida a cada uno de estos subespacios, 
entonces existe una base de V tal que la matriz de A es diagonal por cajas, 
en el que cada caja corresponde a una de la matrices Aj. 

A partir de estos dos hechos y usando (6.5) el resultado es inmediato. 

Veamos (i): para probar que los vectores de (6.10) forman base solo hay 
que tener en cuenta su construction y (ill) de la Proposition 6.4, puesto que 
los vectores elegidos en Ej(X)\Ej- 1 (X) son independientes y los vectores cons- 
truidos en £j_i(A) a partir de la operation (6.8) tambien seran independientes. 

7 E1 orden de estos vectores debe venir de acuerdo al orden impuesto sobre las cajas 
elementales en la forma de Jordan. El orden descrito aquf corresponde a una ordenacion 
de las cajas de mayor a menor tamano. 
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Como tenemos tantos vectores como dimension de E t ( A), forman una base del 
subespacio maximo. 

Por otra parte, si restringimos la aplicacion A al subespacio E t (A) y calcula- 
mos la matriz de esta aplicacion en la base formada por los vectores de (6.10), 
debido a (6.8), vemos que si t > 1, 

= Auf + u* 

de modo que las coordenadas en esta base son (0,..., 0,1, A, 0,..., 0), mientras 
que si t = 1, los vectores uj G -Ed(A), luego son autovectores y por tanto 
Au]j = Auj, es decir, las coordenadas son (0,..., 0, A, 0,..., 0). En definitiva, 
por cada columna de vectores de la tabla (6.9) tenemos una caja elemental de 
Jordan de tamano igual al numero de vectores existente en cada columna. 

Veamos (n): para simplificar los detalles, supongamos que V = M\ ® M 2 , 
con Mi y M 2 subespacios invariantes por A. Debido a que V es la suma directa 
podemos encontrar una base de V juntando las bases de Mi y M 2 . Pongamos 
que 

Base de Mi = {e^ ... ,e fc }, Base de M 2 = {e fe+1 ,... ,e„} 


Como ambos espacios son invariantes, esta claro que 

k 

A.Gj = ^ ^ (XijGi) j = 1 
i=1 

mientras que 

n 

Aej = ^ Pi,j e i> j = k + l,...,n 
i=k-\-1 

Si Ai = (ctij) G AJfc(C) y A 2 = € AJ„_fc+i(C) entonces es facil ver cjue 

la matriz de A en la base {ei,... e„} es 

Ai 0\ 

0 A 2 J 

La extension a r subespacios invariantes es inmediata. 



Veamos el funcionamiento del metodo de construccion de la forma de Jordan 
sobre algunos ejemplos. 
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Comenzamos calculando el polinomio caracteristico: 


\A-\I\ 


1 - A 0 2 -6 

0 1 — A —1 3 

0 0 1 — A 3 

0 0 0 2 — A 


(1 — A) 3 (2 — A) 


Autovalores: A = 1 (triple) y A = 2 (simple). 

Comenzamos el estudio para el autovalor A = 1 de multiplicidad r = 3. 
Construimos el espacio de autovectores asociado i?i(l) = ker(A — I): 


A — I = 



2 

-1 

0 

0 



=> rango(A — I) = 2 


Luego q\ = dim£d(l) = 4 — 2 = 2. Para obtener una base de este espacio 
resolvemos el sistema (formado por las filas segunda y cuarta, con las que se 
tiene rango dos) 


— x 3 + 3^4 

X 4 


0 

0 


=>■ Base de -Ei(l) 


( 1 , 0 , 0 , 0 ) 
( 0 , 1 , 0 , 0 ) 


Puesto que el numero de autovectores independientes asociado a este autovalor 
no coincide con la multiplicidad del mismo (lo cual ya significa que la rnatriz no 
es diagonalizable), procedemos con el siguiente espacio E 2 (l). 


(A-If 





0 0 0 
0 0 0 
0 0 0 
0 0 0 



cuyo rango es uno. Por tanto q 2 = dim£ , 2 (l) = 3, y puesto que es igual a la 
multiplicidad del autovalor, este es el subespacio maximo. Observese que sin 
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necesidad de calcular la matriz ( A — I) 2 podri'amos haber sabido de antemano 
la dimension de este subespacio: tengase en cuenta que los subespacios propios 
generalizados son estrictamente crecientes hasta que se estabilizan, justo cuando 
alcanzan la dimension maxima, que siempre es igual a la multiplicidad del 
autovalor. 

Es facil encontrar una base de £ 2 ( 1 ) resolviendo el correspondiente sistema; 
en este caso obtenemos: 

Base de £ 2 (1) = {(1,0,0,0), (0,1,0,0), (0,0,1,0)} 

Asi pues, tenemos que go = 0, qi = 2 y g 2 = 3 y por tanto, 

Pi = 9i - go = 2, P 2 = <?2 - qi = 1 

La particion de multiplicidades se escribe r = pi +p 2 , es decir 3 = 2 + 1. 

A esta particion le corresponden: 

P 2 = 1 caja de tamafio 2 
Pi — P 2 = 1 caja de tamano 1 

Asi pues, la aportacion del autovalor A = 1 a la forma de Jordan es 


1 

1 


0 

1 



1 


Para construir los vectores correspondientes a este autovalor que apareceran 
en la matriz de paso construimos el esquema 


P2 = 1 

£ 2 (1) 

u? = (0,0,1,0) 

pi = 2 

Ei(l) 

Ui = (2,-1,0,0) u 2 = (1,0,0,0) 


donde uf ha sido escogido arbitrariamente en £ 2 (1)\£i( 1), uj se ha calculado 
mediante u) = (A — 7)uf, mientras que ul, se ha tornado arbitrariamente en 
£i(l), linealmente independiente con u). Vemos que la tabla nos indica tambien 
el numero de cajas: hay un columna formada por dos vectores y una columna 
formada por uno (esto es, una caja de tamano dos, y una caja de tamano uno). 

La aportacion de este autovalor a la matriz de paso es (insistimos en el orden) 

( 2 ,- 1 , 0 , 0 ), ( 0 , 0 , 1 , 0 ), ( 1 , 0 , 0 , 0 ) 

Con respecto al autovalor A = 2, puesto que su multiplicidad es uno, el 
subespacio maximo asociado no puede ser mas que Ei(2) = ker(A — 21). En 
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este caso, 



Sin necesidad de calcularlo, el rango(ti — 21) = 3 (puesto que la dimension 
de este subespacio debe ser uno). Una base se obtendra resolviendo el sistema 
correspondiente, 


—x\ + 2^3 — 6x4 = 0 

—X 2 — X 3 + 3 x 4 = 0 > =>■ Base de £i(2) = {(0,0,3,1)} 

X 3 + 3x4 = 0 I 

En el caso de autovalores simples no hay necesidad de efectuar la partition 
de multiplicidad puesto que solo le puede corresponder una caja elemental de 
tamano uno. 

Como conclusion, la forma de Jordan de A se escribe yuxtaponiendo las 
cajas obtenidas para cada autovalor, 


Ja 


/l 

1 

0 

ON 

0 

1 

0 

0 

0 

0 

1 

0 

\0 

0 

0 

V 


y la matriz de paso escribiendo, por columnas, los vectores obtenidos: 


P = 




verificandose que Ja = P X AP. 


Veamos un nuevo ejemplo en el que van a intervenir valores complejos. 
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Calcular la forma de Jordan de la matriz 



Polinomio caracterfstico: 


\A-\I\ 


-A 1 -10 

0 —1 — A 0 1 

1 1 -A 0 

0 -2 0 1 - A 


F1+AF3 


0 

0 

1 

0 


A + 1 
-1-A 
1 

-2 


—1 — A 2 
0 

-A 

0 


0 

1 

0 

1-A 


— (— 1 — A 2 ) 


—1 — A 
-2 


1 

1 - A 


(A 2 +l) 2 


Autovalores: A = i (doble) y A = —* (doble). Notese que para poder aplicar el 
Teorema de Jordan debemos usar rafces complejas. 

Para el autovalor A = i de multiplicidad r = 2 consideramos el espacio de 
autovectores -Ei(i) = ker(A — il), donde 


A — il = 




-1 

0 

—* 
0 



=> rango(A 


il) = 3 


ya que el menor 


—i 

0 

1 


1 

— 1 — i 

1 


0 

1 

0 


7^0 


(notese que no es necesario calcular \A — il\, pues sabemos que debe ser nulo). 

Entonces q\ = dim E\ (i) = 4 — 3 = 1 y obtenemos una base de este espacio 
al resolver el sistema correspondiente al menor no nulo anterior: 


—ix 1 + x 2 — x 3 
(—1 — i)x 2 + X4 
xi+x 2 - ix 3 


0 1 

„ I 1 , -IX\ + X 2 

0 > => para X 3 = 1 resoivemos 

oj 
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de donde x 2 = 0, (—1 — i)X\ = 1 — i => Xi = i. Finalmente se tiene que X 4 = 0. 
Una base de Ei(i) esta formada por el autovector (i, 0,1,0). Como el numero 
de autovectores independientes asociado a este autovalor no coincide con la 
multiplicidad del mismo (es decir, la matriz no es diagonalizable), calculamos el 
espacio E 2 (i), 



El rango ((A—il) 2 ) = 2 y por tanto q 2 = dimE 2 (l) = 2. Puesto que la dimension 
de este subespacio coincide con la multiplicidad del autovalor, estamos ante el 
subespacio maximo. Resolviendo el sistema 

(—2 + 2 i)x 2 — 2 ix 4 = 0 1 

— 2 ixi — 2 ix 2 — 2 xs + X 4 = 0 I 

con parametros X\ y x 2 obtenemos los vectores (1, 0, —i, 0), (0,1, \ — 1 + i). 

Notese que podemos reemplazar el vector (0,1, \ — |i, 1 +i) por un nuiltiplo 
suyo, ya que seguirlamos teniendo una base de E 2 (i ), as! pues, por comodidad, 
escogemos como base {(*, 0,1, 0), (0, 2,1 — i, 2 + 2 i)}. 

Ya tenemos la information necesaria para encontrar las cajas correspondien- 
tes a este autovalor y los vectores que aporta a la matriz de paso. Comenzamos 
con la partition de multiplicidades: 

Qo = 0, qi=l, Qi = 2 => p x = 1, p 2 = 1 

Es decir, 2 = 1 + 1. A esta partition le corresponde una caja de tamano dos y 
cero cajas de tamano uno, es decir, 


Los vectores aportados a la matriz de paso se obtienen segun la tabla siguiente: 
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P-2 = 1 

E 2 {i) 

u 2 = (0,2,1 - i, 2 + 2i) 

Pi = 1 

Ei(i) 

uj = (l + *,0,1 - i, 0) 


donde uj® ha sido escogido en E 2 (i)\Ei(i), mientras que uj = (A — il)u 2 . 


Como se ha podido comprobar, el calculo de subespacios propios cuando 
el autovalor es un numero complejo es ciertamente tedioso. Sin embargo, como 
vamos a ver a continuation, en los casos de matrices reales con autovalores 
complejos como el que nos ocupa, se presenta cierta “simetria” que facilita 
mucho la labor. 

Se verifica el siguiente resultado: 



Si A £ _Ad„(R) y A £ C es un autovalor entonces A (su complejo conjugado) 
tambien es autovalor y ademas 


A- XI = A- XI 


La demostracion es trivial y se deja al lector. 

Por tanto, como resolver el sistema (A — A/)x = 0 es equivalente a resolver 
{A — A/)x = 0 y 

(A — A/)x = (A — A/)x, 

entonces, por el Lema anterior, las soluciones de {A — AJ)x = 0 son las 
conjugadas de las soluciones de (A — A/)x = 0. 


Ejemplo 6.11 (continuation del ejemplo 6.10) 


En nuestro caso, como A = — i es el conjugado de A = *, entonces los vectores 
de E\(—i) coinciden con los conjugados de E\{i). Luego una base de Ei(—i) 
estara formada por (— i, 0,1,0). 

Analogamente, puesto que (A — XI) 2 = (A —XI) 2 los vectores de E 2 (—i) son 
los conjugados de los vectores de E 2 (i). Asi pues, una base de E 2 (—i) sera 

{(l,0,*,0),(0,2,l + i,2-2i)} 

La partition de multiplicidades es claramente la misma para ambos auto¬ 
valores, lo que significa que la aportacion del autovalor A = —* a la forma de 
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Jordan es: 



Y las mismas operaciones anteriores son validas para los vectores asociados, en 
la version conjugada, es decir 


P'2 = 1 

M-i) 

u? = (0, 2 , 1 + i, 2 — 2i) 

Pi = 1 

Ei(-i) 

u) = (1 — z,0, 1 + i, 0) 


Finalmente, la forma de Jordan y la matriz de paso se escriben 



Como conclusion podemos afirmar que en el caso de autovalores complejos de 
una matriz real, puesto que estos vienen por pares conjugados, solo es necesario 
hacer el estudio sobre uno de ellos, obteniendose los conjugados de los resultados 
obtenidos para el otro. 


mmm Forma de Jordan real 

Como hernos visto en la seccion anterior, una matriz real A £ AJ„(M) puede 
tener autovalores complejos que hagan que su forma de Jordan sea una matriz 
compleja. En esta seccion veremos como asociar a una matriz real una pseudo¬ 
forma de Jordan tambien real, que por abuso de lenguaje llamaremos forma de 
Jordan real. 

Para construir esta nueva matriz debemos recordar que el Lema 6.5 afirma 
que los autovalores de una matriz real vienen por pares conjugados y como 
consecuencia, las particiones de multiplicidad son las mismas. 

Entonces, para calcular la forma de Jordan real tendremos en cuenta: 

(i) Si A £ R es un autovalor de A £ AJ„(K), las cajas correspondientes y los 
vectores asociados permanecen igual. 

(n) Si A = a+Pi £ C\R es un autovalor de A £ (y por tanto A = a— /?i 

tambien es autovalor) con p t cajas de tamano t, Pt-i —pt cajas de tamano 
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t — 1, etc., entonces al par de autovalores A y A le asignamos 


Pt cajas de tamano 

p t -i-pt 

< Pt-2-Pt-i 


2 1 , 

2 (*- 2 ), 


Pi ~P2 


de manera que cada caja tiene la forma 



2 . 


( 6 . 11 ) 


donde B = 



e 1 2 es la matriz identidad de orden dos. 


(in) Si {vi,..., v r } es el conjunto de los vectores que aporta el autovalor A a 
la forma de Jordan, 8 en el orden adecuado, entonces el par de autovalores 
A, A aporta los vectores 


{Re(v!), Im(vi),..., Re(v r ),Im(v r )} (6.12) 


donde recordemos que, si escribimos v,; = x, +iyi entonces Re(vi) = x* y 

Im(vj) = y i. 



Con las notaciones anteriores, los vectores de (6.12) pertenecen al espacio 
E t ( A) © Et( A), son linealmente independientes y dan lugar a la caja (6.11). 


Demostracion: 

Es evidente que los vectores de (6.12) estan en E t ( A) © E t ( A) pues son combi- 
nacion lineal de los vectores de estos subespacios: 


Re(vj) 



Im (yj) 



i 



8 Lo que implica que vi,..., v r son los vectores que aporta A. 


(6.13) 

















6.3 ■ Forma canonica de Jordan 


267 


Ademas, son linealmente independientes pues si consideramos la combina¬ 
tion lineal 

a\ Re(vi) + bi Im(vi) -|-+ a r Re(v r ) + b r Im(v r ) = 0 


usando (6.13), 



y como los vectores Vj y v ? son linealmente independientes, los coeficientes son 
nulos, esto es, 

CL\ zb\ cq zb\ zbj* cir tb^ 

2 2 ~ 2 2 ~ 2 2 ~ 2 2 ~ 
de donde cij = bj = 0, para 1 < j < r. 

Finalmente, dado que Av ? = (a + ij3)Vj. cuando v :/ es un autovector, o bien, 
Avj = (a + ip)vj + Vj_i, separando partes reales e imaginarias se tiene: 

A Re(vj) = a Re(vj) — /? Im(vj), A Im(vj) = ft Re(vj) + a Im(vj) 
en el primer caso; o bien 

ARe(vj) = aRe(vj) — /31m (vj) + Re(vj_i) 

Alm(vj) = /3R e(vj) + alm(vj) + Im(vj_i) 
en el segundo, lo que conduce a cajas de la forma (6.11). 



En el ejemplo 6.11 obtuvimos como forma de Jordan (compleja) y matriz de 
paso las matrices: 



Por tanto, teniendo en cuenta que A = i => a = 0, /3 = 1, la forma de Jordan 
real y la correspondiente matriz de paso se escriben 
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es decir, como al autovalor complejo (y a su conjugado) le corresponde una 
caja de tamano dos, ahora al par de autovalores les corresponden un bloque de 
tamano cuatro con la estructura (6.11). 


Calculo de potencias de matrices 

Una de las ventajas que supone trabajar con la forma canonica de Jordan 
es que permite simplificar cierto tipo de calculo, como puede ser el calculo de la 
potencia fc-esima de una matriz. Mas concretamente, si queremos calcular A k y 
conocemos la forma de Jordan y la matriz de paso tenemos que A = PJP~ l . 
Entonces 

A k = (PJP- 1 ) fe = ((PJP-^PJP- 1 ) (PJP" 1 )) = P^P- 1 

de manera que para conocer la potencia fc-esima de A solo es necesario conocer 
la correspondiente potencia de J y multiplicar convenientemente por la matriz 
de paso. La ventaja es que J es una matriz muclio mas sencilla que A. 

Para calcular J se pueden presentar los siguientes casos: 

■ J diagonal, 



■ J no diagonal, 
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de modo que, 



con 


D = 





La ventaja de esta descomposicion es que D es una matriz diagonal, de 
modo que sus potencias son faciles de calcular, mientras que N es una matriz 
nilpotente de orden n, esto es, N n es la matriz nula. Asi, usando el binomio de 
Newton para matrices (pues D y N conmutan), 


J k = (D + N) k = Y = Y ( k \D k ~ i N l 


i =0 


2—0 


es decir, la suma anterior solo llega hasta i = n — 1, pues a partir de N n , el resto 
de potencias es nulo. Es mas, el calculo de las potencias de N resulta sencillo: 



/ 0 0 1 
0 0 


1 


\ 


V 


1 

0 


esto es, con cada potencia la fila de 1 se desplaza hacia arriba. 



Calculemos A k donde 


2 


I 
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mm - 

CALCULO CON PYTHON 


Como el lector habra podido comprobar, en este tema se realizan gran 
cantidad de calculos que involucran matrices de cierto tamano, por lo que el uso 
de Python esta mas que justificado. Aunque vamos a ver funciones especfficas 
que posee Python para el calculo de autovectores, autovalores, etc., es posible 
realizar estos calculos con lo que ya conocemos de Python. 

Dado que queremos realizar calculos exactos, el modulo SymPy jugara 
un papel fundamental en esta section. Comencemos calculando el polinomio 
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1 

2 

3 

4 

5 

6 

7 

8 
9 

10 

11 

12 

13 


14 

15 

16 

17 

18 

19 

20 
21 
22 
23 


caracteri'stico de la matriz 


1 

-4 

-3 

-2 

-l\ 

0 

-13 

-10 

-7 

-3 

0 

-85 

-59 

-40 

-22 

0 

104 

74 

50 

27 

0 

90 

62 

43 

22 / 


que resulta: 

| A — A/1 = 3 + llx + 14a; 2 + 6a; 3 — x 4 — x 5 


y cuyas rafces son A = — 1 de multiplicidad 4 y A = 3 de multiplicidad 1: 


>>> 

from numpy import matrix 



>>> 

from sympy import Matrix, 

symbols , roots , 

eye 

>>> 

a=matrix(’-1 -4 -3 -2 -1; 

0 -13 -10 -7 

"3; 

0 - 

85 -59 -40 -22;0 104 74 50 

27; 0 90 62 43 

22 ’ ) 

>>> 

A=Matrix(a) 



>>> 

x= symbols ( ’ x ’ ) 



>>> 

C = A-x* eye (5) 



>>> 

p = C.det ( ) 



>>> 

P 



3 + 

ll*x + 14*x**2 + 6*x**3 - 

x * *4 - x**5 


>>> 

roots(p) 



{-1 

: 4, 3: 1} 




Como hemos hecho en ocasiones anteriores, hemos construido la matriz 
usando la funcion de NumPy, puesto que es mas comoda de manejar. Por su 
parte, hemos definido un sfmbolo x (en lugar de A) con el que construir la 
expresion simbolica A — XI (notese el uso de la funcion eye para construir la 
matriz identidad) y luego hemos calculado el determinante. La funcion roots 
nos permite obtener las rafces del mismo, junto sus multiplicidades. Notese que 
el resultado es un diccionario, cuyas claves son las rafces, y sus valores asociados, 
las multiplicidades correspondientes. 

Podemos calcular ahora los subespacios asociados a cada autovalor: 

>>> B = A + eye (5) 

>>> el=B.nullspace() 

>>> el 
[[ 1 ] 

[ 0 ] 

[ 0 ] 

[ 0 ] 

[ 0 ]] 

>>> e2=(B**2).nullspace() 

>>> e2 









24 

25 

26 

27 

28 

29 

30 

31 

32 

33 

34 

35 

36 

37 

38 

39 

40 

41 

42 

43 

44 

45 

46 

47 

48 

49 

50 

51 

52 

53 

54 

55 

56 

57 

58 

59 

60 

61 

62 

63 

64 

65 
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[[l] 

[0] 

[0] 

[0] 

[0] , [ 0] 

[-1/4] 

[-7/8] 

[ 5/4] 

[ 1 ]] 

>>> e3=(B**3).nullspace() 
>>> e3 
[[1] 

[0] 

[0] 

[0] 

[0] , [ 0] 

[ -1/5] 

[-3/10] 

[ 1] 

[ 0] , [ 0] 

[ 0] 

[-1/2] 

[ 0] 

[ 1 ]] 

>>> e4=(B**4).nullspace() 
>>> e4 
[[1] 

[0] 

[0] 

[0] 

[0] , [ 0] 

[-6/11] 

[ 1] 

[ 0] 

[ 0] , [ 0] 

[-4/11] 

[ 0] 

[ 1] 

[ 0] , [ 0] 

[-3/11] 

[ 0] 

[ 0] 

[ 1 ]] 






6.4 ■ Calculo con Python 


273 


Lo que significa que: 

£i(-l) =£((1,0,0,0,0)) 

£ 2 (-l) = £((l,0,0,0,0),(0,-i,-|,f,l)) 

E 3 (- 1) = L((l, 0,0,0,0), (0, -i, 1,0), (0,0, -§, 0,1)) 

E 4 (- 1) = £((1,0,0,0,0), (0, -£,1,0,0), (0, -£, 0,1,0), (0, -£, 0,0,1) 

de modo que dim(i? 1 (—1)) = 1, dim(£ 2 (—1)) = 2, dim(£J 3 (—1)) = 3 y 
dim(£ l 4 (—1)) = 4. A partir de aquf ya tenemos casi toda la informacion per- 
tinente para construir la forma de Jordan, esto es, pi = 1, p 2 = 1, p 3 = 1 y 
Pa = 1- 

Vamos a introducir algunas funciones nuevas para manejar la informacion 
obtenida y no tener que reescribirla en cada momento. Por ejemplo, para 
comprobar que vector de E 4 {— 1) es independiente con los de E 3 (— 1) hemos 
de construir una rnatriz, y calcular rangos: 


67 

>>> 

from mimodulo import rango 

68 

>>> 

m = e3 [0] 

.row_join(e3 [1]) .row_join(e3 [2]) 

69 

>>> 

m 


70 

[l, 

o , 

0] 

71 

[0, 

-1/5 , 

0] 

72 

[o, 

-3/10, 

-1/2] 

73 

[0, 

1 , 

0] 

74 

[0, 

0 , 

1] 

75 

>>> 

rango(m 

.row_join(e4 [3]) 

76 

4 




es decir, 


(l 0 


rango 


0 

0 

0 


V° 


_ l 
5 

_3_ 

10 

1 

0 


0 

0 

1 

2 

0 

1 


o \ 


_3_ 

11 


0 
0 

1 J 


= 4 


Luego (0,-^,0,0,1) e Ea(-1)\E 3 (-1). 

Observese el uso del atributo row_join, que sirve para concatenar una rnatriz 
(o vector) con otra. Tambien hemos usado la funcion rango de nuestro propio 
modulo construida en el tema 5. A partir de aquf, los calculos son directos: 


77 

78 

79 

80 
81 


>>> u4 = 11 * e4[3] 

>>> u3=B*u4 
>>> u2=B*u3 
>>> ul=B*u2 

>>> P=ul.row_join(u2).row_join(u3).row_join(u4) 









a 
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>>> 

P 



83 

[5, 

-4, 

l, 

0] 

84 

[0, 

-10 , 

3 , 

-3] 

85 

[0, 

-35 , 

13 , 

0] 

86 

[0, 

50 , 

-15 , 

0] 

87 

[0, 

40 , 

"17 , 

11] 


lo que nos permite construir la tabla 


Pa — 1 

Ea(- 1) 

uf = (0,-3,0,0,11) 

P:i = 1 

E 3 (- 1) 

uf = (1,3,13,-15,-17) 

P‘1 — 1 

e 2 (- 1) 

u? = (-4,-10,-35,50,40) 

Pi = 1 

Ei(-l) 

u} = (5,0,0,0,0) 


Hemos tenido la precaution de multiplicar el primer vector por 11 para evitar 
en la medida de lo posible las tediosas fracciones. Si anadimos la information 
proveniente del otro autovalor, 


88 

>>> 

B = A - 

3* eye 

(5) 


89 

>>> 

CQ 

II 

LO 

0 

. null 

space 

() 

90 

>>> 

P = P . 

r ow_ j 

oin(u5 [0]) 

91 

>>> 

P 




92 

[5, 

-4, 

i. 

0, 

0] 

93 

[0, 

-10, 

3, 

-3, 

0] 

94 

[0, 

-35 , 

13 , 

0, 

-1] 

95 

[0, 

50 , 

-15 , 

0, 

1] 

96 

[0, 

40 , 

"17 , 

11 , 

1] 


nos result a la matriz de paso: 

/5 -4 1 0 0\ 

0 -10 3-3 0 

P= 0 -35 13 0 -1 

0 50 -15 0 1 

v 0 40 -17 11 1 J 


As! pues, la forma de Jordan tendra una caja de tamano 4 para el autovalor 
— 1 y una caja de tamano 1 para el autovalor 3, algo que podemos comprobar 
facilmente 


97 

>>> j 

=P*A*P. 

inv () 


98 

>>> j 





99 

[-1 , 

1 , 

0 , 

0 , 

0] 

100 

[ o. 

-1 , 

1, 

0 , 

0] 

101 

[ o. 

0 , 

-1, 

1 , 

0] 

102 

1 0 , 

0 , 

0 , 

-1, 

0] 

103 

[ 0 , 

0 , 

0 , 

0 , 

3] 
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Como comentamos al inicio de la section, tanto NumPy como SymPy poseen 
funciones destinadas a calcular autovalores y autovectores de forma mas rapida. 
Por otra parte, hay que tener en cuenta que NumPy realizara el calculo de 
autovalores y autovectores usando metodos numericos que dan lugar a las 
habituales aproximaciones numericas. 

En NumPy podemos calcular autovalores con el modulo linalg. eigvals: 


104 

>>> from numpy import linalg 

105 

>>> 1inalg.eigvals(a) 

106 

array( [-1.00000000 +0.00000000e+00j , 3.00000000 +0.00000000 


e +00j , 

107 

-0.99997160 +4.92035100e-05j , -0.99997160 -4.92035100 


e-05j , 

108 

-1.00005681 +0.00000000e+00j]) 


Notese que no reconoce la multiplicidad del autovalor —1 correctamente. El 
modulo linalg.eig(a) proporciona a la vez, la information de autovalores y 
los autovectores asociados. Con SymPy, el metodo es similar: tenemos modulus 
para vectores y autovectores por separado: 


109 

>>> A.eigenvals ( ) 

110 

{-1: 4, 3: 1} 

111 

>>> A.eigenvects () 

112 

1-1 

tH 1 
l_l 

1_1 

t-H 

1 

v—' 

1_1 

113 

[0] 

114 

[0] 

115 

[0] 

116 

[0]]) , (3, 1, [[0] 

117 

[ 0] 

118 

[-1] 

119 

[ 1] 

120 

[ 1]])] 


aunque como podemos observar, eigenvects proporciona tambien los autova¬ 
lores, su multiplicidad y los vectores del subespacio propio correspondiente. 

En la ultima version de SymPy hasta la fecha (0.7.1) se acaba de imple- 
mentar el calculo de la forma de Jordan, aunque no el de la matriz de paso: 


121 

A 

A 

> A 

• jo 

rdan 

_f orm () 

122 

(N 

one 

, C 

-1, 

1, 

0, 0, 0] 

123 

[ 

0 , 

-1 , 

1, 

0, 

0] 

124 

[ 

0 , 

0 , 

-1, 

1, 

0] 

125 

[ 

0 , 

o , 

0 , 

-1, 

0] 

126 

[ 

0 , 

o , 

0 , 

0, 

3]) 
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APLICACION: OSCILADORES ACOPLADOS 


Entre las multiples aplicaciones de los autovalores y los autovectores hay 
una muy destacada que tiene que ver con el estudio de vibraciones en sistemas 
mecanicos. Aquf vamos a mostrar un ti'pico ejemplo no trivial de vibration de 
un sistema de muelles como el de la figura 6.2, en el que tenemos dos masas 
iguales conectadas entre si, y conectadas a su vez a la pared. 

Denotemos por X\ (t) y X 2 (t) a las funciones que indican el desplazamiento 
lateral (positivo a la derecha y negativo a la izquierda) de cada una de las 
masas desde su position de equilibrio. La fuerza ejercida sobre cada una de 
las masas (ignorando fuerzas de friction y fuerzas externas como la gravedad) 
seguira la segunda ley de Newton: F = m - a, con m la masa y a la aceleracion. 
Por otro lado, la ley de Hooke nos dice que la fuerza que ejerce cada rnuelle 
es proportional a la compresion de este. Como es bien conocido, la aceleracion 
corresponde a la derivada segunda del desplazamiento, de manera que la fuerza 
que actua sobre la primera masa correspondera a la ejercida por los muelles a 
los que esta conectada. Si desplazamos a la derecha la primera masa, el rnuelle 
de la izquierda ejerce una fuerza opuesta al sentido de movimiento igual a —kx\ 
mientras que el rnuelle central ejerce una fuerza igual a k(x 2 — aq), es decir, 


mx"(t) = —kx\(t) + k(x 2 (t) — aq(i)) = k(—2xi(t) + x 2 (t)) 


donde k es la constante de proporcionalidad del rnuelle y m la masa. En la 
segunda masa, un razonamiento similar nos lleva a: 


mx'^it) = —k(x 2 (t) - aq(t)) + k(—x 2 {t)) = k(xi(t) - 2 x 2 (t)) 


Es decir, tenemos en este caso un sistema de ecuaciones diferenciales de segundo 
orden (hay derivadas de orden dos), que admite la representation matricial 
siguiente: 




A (-2 1 

TO l 1 -2 


donde hemos omitido la dependencia en t para simplificar la notation. En forma 
vectorial este sistema se escribe 



No vamos a entrar aqui en como resolver sistemas de ecuaciones diferenciales 
como este, aunque hemos de resaltar que la forma de Jordan de la matriz del 
sistema juega un papel fundamental en la resolution. Lo que haremos sera probar 
con cierto tipo de soluciones expresadas a traves de la exponential compleja: 
en concreto, buscaremos soluciones del sistema de la forma X\(t) = C\e lult y 




6.5 ■ Aplicacion: osciladores acoplados 


277 


§nfTrnrrrir^anmrr^WEJ v | 


Xi 


%2 


Figura 6.2: Sistema de muelles 


X 2 (t) = C 2 e lut , donde Ci, C 2 y ui son constantes a determinar. Derivando y 
sustituyendo en el sistema: 


ci i 2 Lo 2 e iuit = ± (~2cie iuit + c 2 e iut ) 
c 2 i 2 0 J 2 e iuit = ± [c\e iuit - 2 c 2 e iwt ) 

que simplificando y agrupando factores resulta 


-c 1 J 2 e iut = ^{-2ci+c 2 )e^ 
-c 2 L 0 2 e iult = ^(ci -2c 2 )e iult 



Este sistema tendra soluciones no triviales, esto es, distintas de la solucion nula, 
si 


2 -^-w 2 

m in 

— — 2 — — uj 2 


= 0 


Ahora bien, la condicion anterior se puede escribir como 



es decir, u 2 coincide con los autovalores de la matriz A. Y para cada uno de 
estos autovalores las constantes ci y C 2 son las componentes de los autovectores 
asociados a cada autovalor. Un simple calculo nos muestra que los autovalores 
y autovectores resultan: 

Wi = (1, —1), w 2 = \f — —■ y (1) 1) 

v m v to 

Cualquier otra solucion se va a poder expresar como una combination lineal de 
las dos soluciones obtenidas, denominadas modos normales de vibration. 

Los modos normales de vibration corresponden a soluciones del oscilador en 
el que ambas masas se mueven con igual frecuencia. La figura 6.3 muestra el 
movimiento del sistema de ambos modos. Observese que el autovector asociado 
a la frecuencia u>\, (1,-1) nos indica que el movimiento de cada una de las 
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ir v -^Tnrinrm^Ti A i 

iTnrtnp-rrip^inrtnri 

iry^qrra^w^l 

iT^TWwr-^ir^ 

(a) uji 


ir^yirr^winr 5 ^l 

iTirr^TJF-^nnrri 

iTnOT^-^Mr^irr-i 

iTnrswr^yr^TPi 

irm^TOr^inr-i 

iTnrr^nrjr-^wriPi 

ir v -^w^rinririPl 

(b) CU2 


Figura 6.3: Movimiento de los modos normales 


masas tiene direction opuesta (figura 6.3a), mientras que para la frecuencia u> 2 , 
se mueven en la misrna direction (figura 6.3b). 

A la vista de los resultados, ^cual sera el modo de vibration mas peligroso 
para la estructura? Teniendo en cuenta que con la frecuencia uq se producen los 
mayores estiramientos y compresiones de los muelles, parece claro que este modo 
de vibrar puede causar mas dafio en la estructura que cualquier otro. Notese 
ademas que este modo, frecuentemente llamado modo fundamental , corresponde 
a la frecuencia asociada al menor autovalor. 

En el estudio de estructuras es importante calcular el modo fundamental 
de estas, pues si son excitadas con una frecuencia proxima a su modo funda¬ 
mental los desplazamientos producidos pueden superar el maxirno de lo que la 
propia estructura puede resistir. Tal y como hemos visto, el calculo del modo 
fundamental corresponde al menor de los autovalores. 


□ 1 - 

EJERCICIOS 


Ejercicios de repaso 


|31 Hallar el polinomio caracteristico y los autovalores de las siguientes 
matrices: 
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(e) 


( 


8 

18 

6 


-6 

-13 

-3 




(g) 



0 0 
0 0 
0 0 
0 0 




0 0 

0 1 

1 2 

-1 1 



[2J Para cada una de las matrices del ejercicio 1 hallar, si es posible, una 
base de autovectores. 


I3M Decir cuales de las siguientes matrices pueden reducirse a una diagonal 
y encontrar una matriz de cambio de base (real): 


(a) 




(b) 



(d) 


/o 0 

V 1 0 



(e) 




|21 Encontrar la forma canonica de Jordan y la matriz de cambio de base 
correspondiente de las matrices 


(a) 



-1 

2 

-1 



(b) 


/-14 1 
( -13 0 
y-17 i 



(c) 



-1 

3 

0 




1*1 En los siguientes casos hallar los autovalores (reales o complejos), los 
autovectores de C n y la matriz de paso en su forma real y/o compleja de: 


(a) 
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IS] Calcular A 50 donde 



Problemas 

|3| Determinar los coeficientes a, &, c, d, e y / de la matriz 


A = 



sabiendo que (1,1,1), (1,0,—1) y (1, —1,0) son autovectores. ^Cuales son los 
autovalores de la matriz? 

|3| Determinar para que valores a, b G R, la matriz 


A = 



b 

-1 

0 


A 

0 G A4 3 (R) 

V 


es diagonalizable. 

|3I Dada la matriz 



probar que esta es diagonalizable para todo a/0. 

131 !] Hallar las formas canonicas y las correspondientes matrices de paso 
de las aplicaciones / y g cuyas matrices respecto de la base canonica son, 
respectivamente, 



(—1 

-4 

-3 

-2 

-l\ 




-4 

-3 

-2 

-A 


0 

-13 

-10 

-7 

-3 



0 

-12 - 

-10 

-8 

-3 

(a) 

0 

-85 

-59 

-40 - 

-22 


(b) 

0 

-13 - 

-11 

-13 

-1 


0 

104 

74 

50 

27 



0 

37 

32 

30 

6 


l o 

90 

62 

43 

22 j 



1° 

28 

20 

18 

V 

Indication: 

PfW 

= (A 

+ 1) 4 (3 

-A) 

y 

Pg( A) = 

(5 

- A) 3 (A 

— 2) 2 
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lam Hallar la potencia n-esima de la matriz 


/a b 
A = | b a 
\b b 



|3£| Calcular, si es posible, el Inn A n , 

n—> oo 


donde A es la matriz 


(a) 



0.15\ 

0.85,/ 




Ejercicios teoricos 

13tm Probar que los autovalores de una matriz real y simetrica de orden dos 
son siempre reales. 

|3£] Probar que si A es no singular, entonces los autovalores de A -1 son los 
inversos de los autovalores de A. 

Encontrar los autovalores y autovectores de la aplicacion derivada 

D : Pr[x] -5> Pr[it] 
p{x) -» p'(x) 

IatM Probar que si A es un autovalor de una matriz A asociado a un autovector 
x y p es un autovalor de otra matriz B asociado al mismo autovector x, entonces 
A + n es un autovalor de A + B asociado a x. 

|3U Sean A,B£ Aln(IK) dos matrices invertibles, v £ K" un vector no nulo 
y A £ K un escalar no nulo tales que se verifica Av = A Bx. ^Cuales de las 
siguientes afirmaciones son ciertas? 

(a) v es un autovector asociado al autovalor A de la matriz A~ X B. 

(b) v es un autovector asociado al autovalor A de la matriz BA~ l . 

(c) v es un autovector asociado al autovalor A -1 de la matriz BA -1 . 

(d) v es un autovector asociado al autovalor A de la matriz AB~ l . 

(e) v es un autovector asociado al autovalor A de la matriz B~ X A. 

* ia>M Sean A, B £ _M n (K). ^Cuales de las siguientes afirmaciones son ciertas? 
(a) A es diagonalizable si y solo si A — I es diagonalizable. 
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(b) 1 es autovalor de A si y solo si A — I no es invertible. 

(c) Si v es un autovector asociado al autovalor A de la matriz BA y B es 
invertible, entonces I3 _1 v es un autovector asociado al autovalor A de la 
matriz AB. 

(d) 0 es autovalor de AB si y solo si 0 es autovalor de BA. 

*|3£] Dada una suma directa V = W © Z podemos definir E £ £(P) como 
E(v) = zsiv = z + w con zeZywe W. 

(a) Probar que E 2 = E, W = ker (E) y Z = lm(E). 

(b) Encontrar los autovalores de la aplicacion E. 

* iawil Supongamos que A es una matriz equivalente a otra matriz D 1 diagonal 
donde los elementos de la diagonal son Ai, A 2 , X n tal que A,; < 1 para 
i = 1, n. Sea Pk{A) = I + A + A 2 + ... + A k . 

(a) Probar que si A = PDP~~ l entonces 

p k (A) = P(I + D + D 2 -\ -+ D k )P~ l 


(b) Demostrar que Km p k (A) existe. 


k—> 00 


(c) Si denotamos por B a la matriz '}2’kLi A k = I + A + A 2 + ..., probar que 
B = {I-A)~ 1 . 

Indication: considerese lim (/ — A)p k {A). 

k—yoo 


* iaw Supongamos que la matriz A es equivalente a la matriz diagonal D cuyos 
elementos de la diagonal son Ai, A 2 ,A„. Sea 


. A A 2 A k 

Pk(A)-I+ - + — + 


Demostrar que si A = PDP 1 entonces 

s Al 0 
0 e A2 


lim pk(A) = P 

k—> 00 


0 0 



00 u 
X* 


Indication: — = e x . 

^ k\ 


k =0 
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Ejercicios adicionales 

135£J Usar Python para encontrar la forma de Jordan de la matriz 


/- 4 

-5 

-3 

1 

-2 

0 

1 

- 2 N 

4 

7 

3 

-1 

3 

9 

-1 

2 

0 

-1 

0 

0 

0 

0 

0 

0 

-1 

1 

2 

-4 

2 

0 

-3 

1 

-8 

-14 

-5 

1 

-6 

0 

1 

4 

4 

7 

4 

-3 

3 

-1 

-3 

4 

2 

-2 

-2 

5 

-3 

0 

4 

-1 

V 6 

7 

3 

0 

2 

0 

0 

3/ 


lawtl Considerese un sistema de muelles corno el de la figura adjunta com- 
puesto por tres masas iguales conectadas entre si por tres muelles de identica 
longitud y la misma constante de proporcionalidad k. 


Denotemos por y \, e j /3 al desplazamiento vertical (hacia 
abajo) de cada una de las masas. Probar que el sistema de ecuacio- 
nes diferenciales que modela el movimiento del sistema viene dado 
por 



y usar Python para encontrar los modos fundamentales de la es- 
tructura. 













7 Ecuaciones lineales en diferencias 


□ 9 - 

INTRODUCCIOIM 

Numerosos procesos temporales, esto es, que evolucionan con el tiempo, 
pueden ser modelados a traves de sistemas discretes, en los cuales se considera 
que el paso de un estado del sistema al siguiente esta separado por un intervalo 
temporal determinado. 

Por ejemplo, imaginemos que pretendemos averiguar la evolution de un 
fondo de inversion cuyos intereses se abonan al final de un perfodo estipulado 
(usualmente, cada mes). De este modo, el capital existente no se incrementa de 
forma continua, sino que lo hace mes a mes. Los intereses abonados al final del 
primer mes incrementan el capital, de manera que el calculo de los mismos al 
mes siguiente difiere del calculo en el mes anterior. 

De este modo, podemos establecer una sucesion de valores que proporcione 
el capital obtenido en cada mes; esto es, Xq, x\, X 2 , ■ ■ ■, siendo xq nuestro capital 
initial. 

El calculo del capital en el mes fc-esimo vendra dado por el capital en el mes 
k — 1 junto con los intereses que ha generado. Si i denota el interes mensual 
en%, entonces 

Xb = rt_i H- Xi,-i = ( 1 H-) Xi.-i , k > 1 

k k l t 10Q fc l ^ 100y / k 11 

Esta ecuacion representa un fenomeno dinamico discreto, y se denomina 
comunmente ecuacion en diferencias. La ecuacion proporciona los valores en 
la etapa k a partir de los valores en la etapa k — 1. El interes en estas ecuaciones 
esta en averiguar el estado del sistema en una etapa determinada, o su evolu¬ 
tion en el estado lmfite, es decir, cuando k —> oo, sin necesidad de ir recorriendo 
todos los estados uno a uno. 

En este ejemplo concreto, es facil obtener el valor en la etapa k pues, 

I * = ( 1+ i5o) I ‘- I = ( 1 + i5o) I *- 2 = '" = ( 1+ i5o) x ° 

de manera que es posible obtener dicho valor directamente a partir del dato Xq . 
Es decir, hernos resuelto la ecuacion en diferencias. 
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Este tipo de ecuaciones pueden complicarse, por ejemplo, variando el tipo 
de interes de un mes a otro. En tal caso, la ecuacion resultarfa 



con i(k) el interes en el mes fc-esimo, lo que obviamente dificulta el estudio. 

De forma similar, pueden encontrarse fenomenos modelados por ecuaciones 
en diferencias de orden superior, esto es, que involucran no solo lo que ocurre 
en un estado inmediatamente anterior, sino lo ocurrido en estados anteriores, 
como por ejemplo, la sucesion de Fibonacci 1 


x k +2 = Xk +1 + X k , k> 0 


En este caso estamos ante una ecuacion en diferencias de orden dos (pues el 
calculo de un estado involucra dos estados anteriores). 

Incluso es posible tener sistemas de ecuaciones en diferencias, mas conocidos 
como sistemas dinamicos discretos que equivalen a sucesiones multidimensio- 
nales, es decir, una sucesion de valores vectoriales, cuya evolution, al igual que 
las ecuaciones en diferencias, viene marcada por el comportamiento del sistema 
en el estado anterior (en los sistemas de primer orden), o en estados anteriores 
(si el sistema es de orden superior). Al igual que antes, el interes en este tipo 
de sistemas es estudiar su dinamica, es decir averiguar hacia donde tiende el 
sistema a partir de un dato initial. 


rdS^BlD' 


Una ecuacion en diferencias de orden n es una expresion del tipo 


f (^o •Xk-\-1 ) * • • j Xk-\-n) — 0 


Si / es lineal en x k , ■ ■ ■, x k+n se dira ecuacion en diferencias lineal , que de forma 
generica se escribe 


a n (k)x k+n H-h ai(k)x k+1 + a 0 (k)x k = g(k) 


donde do,..., a n y g son funciones. En el caso en el que ao,... ,a n sean constan- 
tes se dira ecuacion en diferencias lineal con coeficientes constantes. Si ademas 
g = 0 se dice ecuacion homogenea y si g 0 no homogenea. 

Si / es una funcion con valores vectoriales y x k es tambien un vector, 
estaremos hablando de sistemas de ecuaciones en diferencias. 


1 1 .a sucesion toma su nombre del italiano Leonardo da Pisa, mas conocido como Fibo¬ 
nacci, aunque aparece con anterioridad en trabajos de matematicos indios. Tiene numerosas 
aplicaciones en ciencias de la computacion, biologfa o teoria de juegos. 
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Si yj ?\■ y'f’. n> son soluciones de la ecuacion lineal homogenea, entonces 
cualquier combinacion lineal suya tambien es solucion. 


Demostracion: 

En efecto, si y k \ ..., y' p " l ' > resuelven la ecuacion 

a n {k)x k +n H-b ai(fc)a;fc+i + a 0 (k)x k = 0 

se tendra: 

M%l+„ + • • • + aiO)^ + a 0 {k)y { ^ = 0 
+ • • • + «i(fc)2/i+i + ao{k)y^ ] = 0 

a„( fc )2/i+i + • • • + ai(fe)^7i + «oO )2/i m) = o 
Si ahora consideramos una combinacion lineal de las ecuaciones anteriores: 

0 = ci (M%i+ n + • • • + ai(fc)y^! + ao(k)y£ ] ) +■■■ 

+ c m (a n (%£^ +-f mik^ll + a 0 (fe)^ m) ) 

= a n (fc) (ciy^ n + • • • + c m y^y + • • • + 0l (fc) (ciy^ + • • • + c m y^|) 

+ a 0 (/c) (ciy[ 1} H-b c m y[ m) ^j 

es decir, Ci y[l 1 + ■ ■ ■ + c rn y { ' p ." ) es solucion de la ecuacion en diferencias. 



Un conjunto de n soluciones linealmente independientes de una ecuacion 
lineal homogenea de orden n se dice sistema fundamental de soluciones. 



Llamaremos solucion particular a cualquier solucion de la ecuacion no ho¬ 
mogenea. 
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Si yW es solucion de la ecuacion lineal homogenea e es una solucion 
particular de la ecuacion no homogenea, la suma de ambas tambien es solucion 
de la ecuacion no homogenea. 


La demostracion es elemental y se deja al lector. 


HI - 

ECUACIONES Y SISTEMAS LINEALES DE PRIMER ORDEN 

Consideremos la ecuacion de primer orden homogenea con coeficientes cons- 
t antes: 

dlXk+l Uo Xk — 0 

Dividiendo por a\ (si ai = 0 la solucion es trivialmente cero), se tiene que 
Xk+i = axk , con a = —fy. Realizando reiteradas sustituciones hacia atras, 

x k = a k x 0 

expresion que nos proporciona la solucion de la ecuacion lineal de coeficientes 
constantes de primer orden. 

Para tratar el caso de sistemas lineales de ecuaciones en diferencias con 
coeficientes constantes vamos a ver unos cuantos ejemplos en dimension dos. 



(i) Estudiemos el siguiente sistema de primer orden homogeneo con coeficien¬ 
tes constantes: 

\ Xk -{_! — Xk yk 

[ Vk+i = 2z fe + 4 y k 

El sistema se puede representar en forma matricial, 

/a; fc+ i\ _ fl -lA / x k \ 

\yk+i) \2 4 J [y k J 

o abreviadamente Xj, +1 = Ax k , con 
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A1 igual que en el caso anterior, si realizamos sustituciones regresivas: 

x fc = Ax t _i = AAx k _ 2 = A 3 x fc _ 3 = • • • = A k x 0 

Notese que para resolver estos sistemas tendriamos que calcular la poten- 
cias fc-esimas de la matriz A , tal y como virnos en la section 6.3.2. Sin 
embargo, vamos a aprovechar la information proveniente de la forma de 
Jordan para obtener la solution del sistema dinamico de modo que no sea 
necesario calcular inversas y multiplicaciones de matrices. 

Calculamos para ello la forma de Jordan de A: sus autovalores son A = 2 y 
A = 3, y por tanto se trata de una matriz diagonalizable. Si consideramos 
la base formada por los autovectores, y denotamos por P a la matriz de 
cambio de base de la canonica a la base formada por los autovectores 
sabemos que A = P~ 1 JP. Si hacemos el cambio de base y*, = Px^ 
entonces 


x k+1 = Ax k => Px t+ i = PAx k => Px k+ 1 = JPx k 


y por tanto, 

y/c+i = Jyk => yk = J k yo 

Es decir, lo que sucede es que si elegimos la base adecuada (en este caso, 
la base formada por los autovectores de A), el sistema dinamico se puede 
reescribir en terminos de la matriz de Jordan. Puesto que 


(2 0\ jt= h‘ o\ 

\0 3 J [0 3 k J 


/ °i 2 \ 

obtenemos que y*, = , con c\ y C 2 las componentes 

\c 2 3 k J 

ciendo el cambio anterior, x k = P 1 y k , se tendra que 


x fe = P 1 



Observando que P~ l es la matriz de cambio de la base de autovectores a 
la base canonica, bastara calcular los autovectores, que en este caso son 
(1, —1) y (1, —2) para obtener: 


/ x k 

\Vk 




3 k 


como solution general. Las constantes C\ y C 2 se determinan a partir de 
los datos iniciales. 
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Si miramos el aspecto de la solution general encontrada, podemos evitar 
de cierta forma la multiplication de matrices y el calculo de autovectores 
razonando del siguiente modo: dado que los autovalores son 2 y 3, la 
solution general que buscamos tendra el siguiente aspecto: 

x fc = C 1 2 fc + C 2 3 fc 


donde Cb y C 2 son vectores constantes a determinar. Dado que se trata de 
un sistema bidimensional de primer orden, la solution general solo depende 
de dos parametros (y no cuatro, como sefialan los vectores Ci y C 2 ). Si 


denotamos por Cj = 



e imponemos cualquiera de las ecuaciones del 


sistema se obtiene que 


x k +i = - j/fc => Cn2 fc+1 + c 2 i3 fc+1 = cn2 fe + c 2 i3 fe - c 12 2 k - c 22 3 fc 

de donde 

2cn = Cn — ci 2 f cn = —Ci 2 

3c 2 i = c 2 i — c 22 | 2c 2 i = —c 22 

Es decir, la solution general viene dada por 

Cl1 C21 ^ 3 fc 

Vkj V _Ci1 / V _2c21 / 

que coincide con la obtenida antes. 

(il) Veamos ahora el sistema 

x k +i — y k 

Uk +1 = ~x k + 4 y k 

que en forma matricial es, 

/ x k+1 \ _ I 2 l\ / x k \ 

\Vk+1) \-l 4/ \y k ) 

El calculo de la forma de Jordan de A se realizo en el ejemplo 6.12, 
obteniendose que 

T ( 3 A rk ( 3k k3k ~A 

J= (o sj"' 7 =1° 3* J 
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Procediendo como en el ejemplo anterior, usando el cambio = Pxt, 
donde P sera la inversa de la matriz de paso en el calculo de la forma de 
Jordan, entonces 


y k = J k yo => y k 


/ci3 fc + c 2 k3 k ~ 1 \ 

V ) 



fc3 fc_1 


Para deshacer el cambio, vamos a razonar como en el ejemplo anterior; 
puesto que x^, = P~ x y kl en definitiva tendremos que 

x fc = C ± 3 k + C 2 k3 k 


con Ci y C 2 vectores constantes a determinar (que dependeran solo de 
dos parametros, y no de cuatro). Usando que Xk+i = “2x k + yk y poniendo 


C, = 


Cji 

K c i1, 


(3cn + 3c 21 )3 fe + 3c 21 fc3 fc = (2cn + ci 2 )3 fe + (2c 2 i + c 22 )k3 k 

se tiene que ci 2 = cn + 3c 2 i y c 2 i = c 22 , por tanto, la solucion general 
queda como 

= / c n \ nk , ( c 2i X 
\Vk 1 \ C 11+ 3c 21/ VC21. 


3 fc + r* 1 ] k3 k 


(ill) Veamos iinalmente un ejemplo que involucra autovalores complejos. Dado 
el sistema de ecuaciones en diferencias 

j •£&-{-1 — Xfc J - yk 

[ y k+ i = -x k + y k 

cuya matriz asociada es A = f ) , su forma de Jordan (compleja) es 


J = 


1 + i 0 ' 
. 0 1 -i, 


En este caso es mas conveniente acudir a la forma polar de los numeros 
complejos para calcular las potencias de J : 
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Como yk = J k yo, obtendremos 



A1 igual que en los ejemplos anteriores, multiplicando por P 1 llegamos a 
una solucion general de la forma 

x fc = C x (Vi)* cos (f) + C 2 (V2) k sen (f) 


en la que, para determinar los vectores 


C, = 



deberi'amos imponemos alguna de las ecuaciones del sistema, por ejemplo 
Xk+i = Xk + Vk, dando lugar a 


Cll 


(v^) 


fc +1 


cos 


(k + \)tt 
4 


C21 


(v^) 


fc+l 


sen 


(.k + 1)7r 

4 


(cn +C12) (v / 2) fc cos + (c 2 i +C22) (v / 2) fe sen 


Para poder obtener una relacion entre coeficientes es preciso usar las 
conocidas formulas trigonometricas 


cos(A + B) = cos(A) cos (B) — sen(A) sen(i?) 
sen(A + B) = sen(A) cos (B) + cos(A) sen(i?) 

y realizar operaciones. Sin embargo, en estos casos es mas conveniente 
obtener la relacion entre los coeficientes de los vectores C, razonando de 
rnodo distinto. En lugar de imponer una de las ecuaciones el sistema, po- 
demos apoyarnos en los valores iniciales. Por ejemplo, la solucion obtenida 
para k = 0 se escribe: 








7.2 ■ Ecuaciones y sistemas lineales de primer orden 


293 



Los calculos realizados en el ejemplo anterior pueden generalizarse a sistemas 
de dimension superior, obteniendose el siguiente resultado. 



Sea Xfc + i = Axk un sistema de ecuaciones lineales en diferencias de primer 
orden con coeficientes constantes de dimension n, es decir, A £ ,M n (R). Las so- 
luciones del sistema estan formadas por una combinacion lineal de las siguientes 
soluciones: 

■ A fe , si A es un autovalor real simple de A. 

■ A fe , k\ k , ..., k m ~ 1 \ k , si A es un autovalor real de multiplicidad m de A. 

■ r k cos(k9 ), r k sen(kd) si A = re l8 es un autovalor complejo de A (y por 
tanto, su conjugado tambien). 

■ r k cos(k9), r k sen(k9), kr k cos(k9), kr k sen(k9), k m ~ 1 r k cos(k9), 

k rn ~ 1 r k sen(k,9), si A = re l8 es un autovalor complejo de multiplicidad 
m de A (y su conjugado tambien). 


La demostracion sigue las misrnas ideas desarrolladas en el ejemplo 7.1, 
aunque los detalles resultan muy engorrosos, por lo que la omitiremos. 
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HI - 

ECUACIONES DE ORDEN SUPERIOR 

A traves del ejemplo 7.1 hemos visto que la resolution de sistemas lineales 
homogeneos con coeficientes constantes de primer orden se lleva a cabo mediante 
el computo de los autovalores de la matriz del sistema, a partir de los cuales 
obtenemos el sistema fundamental de soluciones. Veamos como aprovechar 
esta idea para abordar ecuaciones lineales con coeficientes constantes de orden 
superior. 

Dada la ecuacion en diferencias de orden n, 

Xk-\-n O'n— l^fc+n— 1 d~ ‘ * * "b aO^k — 0 (7.1) 

definimos el vector de n componentes 

y k \Xk ) *£fc+l j • * * ) ^k-\-n— 1) 

de manera que y^+i = (xk+ 1 , ■ ■ •, Xk + n )■ Entonces la ecuacion (7.1) se transfor¬ 
ma en el sistema de primer orden 



No es diffcil probar por induction que el polinomio caracterfstico de la matriz 
anterior es 

A" + a n —i\ n 1 + • • • + aiA + ao 

de manera que los autovalores de la matriz se deducen de las soluciones de lo 
que se conoce como ecuacion caracteristica de (7.1): 

A n -t~ a n —\\ n ■ • • A aiA -t- no = b 

la cual puede obtenerse directamente de la expresion (7.1) sin necesidad de pasar 
por el sistema. 

A partir de lo establecido en el Teorema 7.1 se deduce que: 

(i) Si A es una rafz real simple de la ecuacion caracteristica, una solution 
vendra dada por A fe . 

(il) Si A es un raiz de nmltiplicidad m de la ecuacion caracteristica, obtendre- 
mos m soluciones de la forma: A fc , fcA fc , ..., fc m_1 A fc . 

(ill) Si A = \\\e ±l9 es un raiz compleja (junto con su conjugada) de la ecuacion 
caracteristica, entonces tenemos dos soluciones del tipo |A| fc cos(fc0) y 
|A| fe sen(fcd). 
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(iv) Si A = \X\e ±ie es un rafz compleja (junto con su conjugada) de mul- 
tiplicidad m, entonces las 2 m soluciones asociadas son: |A| fe cos(kd), 
k\X\ k cos(k6), k m ~ 1 \X\ k cos(k9), |A| fc sen(kd), k\X\ k sen(k9), 
fc m_ 1 |A| fc sen(k6). 


(i) Resolvamos la siguiente ecuacion de orden dos 

Consideramos la ecuacion caracten'stica asociada: 

A 2 - 2A + 1 = 0 

cuyas rafces son A = 1 doble. Entonces, la solution general de la ecuacion 
es 

Xk = C\l k + c 2 kl k = Ci + c 2 k 

(n) Resolvamos la ecuacion en diferencias 

X k +A = ~Xk, x 0 = x 2 = 0, Xi=Xz = l 

La ecuacion caracten'stica es ahora: A 4 + 1 = 0, cuyas rafces son 

A„ = e^T+ ra f) con n = 0,1, 2,3 

Por tanto la solution general queda 

f knX ( knX ( SknX f SknX 

Xk = Ci cos ^ — j +c 2 sen ^ — J + c 3 cos I —— J + c 4 sen I —— J 

Para determinar la solution con los datos iniciales dados no tenemos mas 
que sustituir: 

x 0 = 0 => ci + c 3 = 0, x\ = 1 => ^ (ci + c 2 — c 3 + C4) = 1 


x 2 = 0 => c 2 + C 4 = 0, x 3 = 1 => (—Ci + c 2 — c 3 — C 4 ) = 1 


de donde se deduce que Ci = c 2 = c 3 = C 4 = — Es decir, la solution 


es 


If (kir\ f kn\ (3kn\ (3kn 

= _ ^ cos j + S en y — J-cos[—J- sen 
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□ HI Ecuaciones no homogeneas 

Para resolver ecuaciones en diferencias no homogeneas haremos uso de la 
Proposition 7.2, es decir, primero resolveremos la ecuacion homogenea y luego 
obtendremos una solution particular de la no homogenea. La suma de ambas 
nos dara la solution general de la ecuacion no homogenea. 

Para obtener soluciones particulares buscaremos soluciones que se asemejen 
a la parte no homogenea de la ecuacion a resolver, introduciendo constantes 
indeterminadas que resolveremos imponiendo que se satisfaga la ecuacion. 

Consideremos la ecuacion lineal de primer orden no homogenea 


x k +i =ax k +P (7.2) 

La solution de la ecuacion homogenea la vimos al initio de la section 7.2, 
resultando xk = Ca k . Para obtener una solution particular de la ecuacion no 
homogenea probaremos con una solution del tipo Xk = A, con A constante. 
Sustituyendo en (7.2): 

A = a A + /3 => A = —, si a + 1 

1 — a 

Si a = 1, podemos probar con Xk = Ah, que nos lleva a 


A(k + l) = Ak + (3=>A = [3 


Asi pues la solution general de la ecuacion no homogenea es: 


Xk 


Ca k + si a ^ 1 
Ca k + (3k si a = 1 


La constante C quedara determinada con la condition inicial. 
Veamos algunos ejemplos: 



(i) Resolver la ecuacion de primer orden 

x k +i = 5 xk + 3 fe , x 0 = 1 

Al igual que antes, resolvemos en primer lugar la ecuacion homogenea 
Xk +i = 5 Xk cuya solution general es Xk = C5 k . Para obtener una solution 
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particular de la ecuacion no homogenea probaremos con una sucesion del 
tipo Xk = A3 k . Sustituyendo en la ecuacion 

A3 k+1 = 5A3 k + 3 k ^A = -^ 

La solucion general es Xk = + C5 k . Para obtener la solucion con 

condicion inicial Xq = 1 bastara sustituir en la expresion anterior para 
obtener que C = | y por tanto 

« = 4 3 ‘ + s 5 ‘ 

(ii) Resolvamos la ecuacion 

Xk +2 + Xk +1 + Xk = k 2 + k + 1 , x 0 = xi = 0 

Para resolver la ecuacion homogenea observamos que la ecuacion carac- 
teristica es 

A 2 + A + 1 = 0 

cuyas raices son A = — \ ± i = e ± ^ 1 . Luego la solucion general de la 
ecuacion homogenea es 

f 2kn\ ( 2kir\ 

x k = ci cos J + c 2 sen J 

Por otra parte, buscaremos una solucion particular de la forma Xk = 
Ak 2 + Bk + C. Sustituyendo, 

A(k+2) 2 +B(k+2)+C+A(k+l)' 2 +B(k+l)+C+Ak 2 +Bk+C = k 2 +k +1 


se obtiene 





obteniendose asi la solucion general de la ecuacion dada: 

+ C 2 sen 


Xk = Ci cos 


2kn 

T 


2kn 

~Y~ 


1 .2 1 , 1 
3*= '3 t+ 9 


Sustituyendo esta expresion para Xq = x\ = 0 se obtiene que Ci = — | y 

° 2 ~ ~ 3 %/ 3 ' 

(ill) Resolvamos la ecuacion en diferencias 


Xk-i-4 Xk — 2k + 1 
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La solucion general de la ecuacion homogenea la hemos calculado en (il) 
del ejemplo 7.2: 


/ Jctt \ / kir \ / 3fc7r \ ( 3kir \ 

x k = ci cos I — I + c 2 sen I — J + c 3 cos I —I + c 4 sen I I 

Por otro lado, buscaremos una solucion particular de la ecuacion no 
homogenea que sea de la forma Xk = Ak + R, obteniendose 

A(k +4) + B + Ak + B = 2k + l=>A = l, B = 

y por tanto, la solucion general de la ecuacion es 

f kn\ (kir \ f 3kn \ (3kn \ 3 

x k = Ci cos I — J + c 2 sen I — I + c 3 cos I J + c 4 sen I —j— J + k - - 


(iv) Resolver el sistema de ecuaciones en diferencias 


x k -\-1 

Vk+l 


yk + k 
9 x k 


xq = 0, yo = l 


Procedemos a calcular la solucion general del sistema homogeneo asociado 


l\ fXk\ 

\y k +i) \9 0/ \y k ) 


cuyos autovalores son 3 y —3, y los autovectores (1,3) y (1, —3), respecti- 
vamente; de modo que la solucion general vendra dada por 


h-(rMr 

\yk) \3cn y \-3 c 2 i 

Para buscar una solucion particular procedemos de forma similar a los 
ejemplos anteriores, es decir, buscamos un vector de la forma 

/ Xk\ _ (Aik + B x \ 

\2/fc y \A 2 k + B 2 J 

Imponiendo que esta expresion sea solucion de la ecuacion en diferencias: 



A\(k + 1) + B i — A 2 k + B 2 + k 
A 2 (k + 1) + B 2 = 9(^4ifc + B\) 
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se obtiene el sistema 


Ai — A 2 
A\ + B\ — B 2 
Ai — §A\ 
A‘2 + B 2 — 9-E>i 


cuya solucion es A\ = — B\ = — = — | y B 2 = — gg. La solucion 

general de la ecuacion no homogenea sera 



(—3) fc + 


— lb — 

8 32 

_9_ 

8 ^ 32, 


^ —3C21 

Imponiendo ahora la condition initial xq = 0, yo = 1 se tiene 
Cn + c 2 i - ^ = 0 7 13 


3cn — 3 c 2 1 — 32 — 1 


=> Cll = C21 = 


96 


urn - 

CADENAS DE MARKOV 

Una de las aplicaciones tipicas de los sistemas dinamicos discretos aparece 
cuando los sistemas de ecuaciones en diferencias tratan con cantidades porcen- 
tuales que pasan de un estado a otro sin variar en su conjunto. Veamoslo en el 
siguiente ejemplo. 



Supongamos que los N habitantes de una cierta ciudad realizan sus compras 
en uno de los tres supermercados existentes X , Y y Z. Considerando que las 
grandes compras se realizan una vez por semana, y que los consumidores compa- 
ran calidad, precio, comodidad, etc., algunos deciden cambiar de supermercado, 
mientras que otros permanecen fieles. Pongamos que el porcentaje de clientes 
que al cabo de una semana deciden permanecer o cambiar de supermercado esta 
dado en la siguiente tabla: 
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X 

Y 


X 

.80 

.20 

.10 

Y 

.10 

.70 

.30 

Z 

.10 

.10 

.60 


donde el porcentaje p que aparece en la fila * y la columna j significa que si 
en una semana hay m clientes que compran en el supermercado j, la semana 
siguiente habra pm clientes que compran en el supermercado i. Suponiendo que 
el nurnero de clientes es constante, se trata de averiguar cual sera el mercado 
que atraiga al mayor nurnero de compradores. 

Si denotamos por x k . yk y z k al nurnero de clientes que compran en los 
supermercados X, Y y Z en la semana k, respectivamente, es facil darse cuenta 
que 

x k+ i = 0.80a; fe + 0.20 y k + 0.1 z k 

Vk+i = O.lOxfc + 0.70y fc + 0.3z k (7.3) 

z k + i = O.lOxfc + 0.10? i k + 0.6 z k 

es decir, tenemos un sistema de ecuaciones en diferencias lineal homogeneo. 


El anterior es un tipico ejemplo de lo que se conoce como una cadena o 
sistema de Markov. 2 



Diremos que una matriz real cuadrada es de Markov si sus elementos son no 
negativos y sus columnas surnan uno. 


La interpretation ti'pica en terminos de probabilidad de una matriz de 
Markov es la de un sistema que consta de n estados posibles E], E n en 
la que la probabilidad de pasar del estado Ej al estado Ei viene dada por el 
elemento . 

Veamos algunas propiedades interesantes de estos sistemas. 


~ Introducidas por el matematico ruso Andrei Andreyevich Markov en 1907. 
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Si A es una matriz de Markov entonces: 

(i) Todos sus autovalores A verifican que |A| < 1. 
(n) A = 1 es autovalor de A. 


Demostracion: 


(i) Procederemos por reduction al absurdo. Supongamos que |A| > 1 es un 
autovalor de A asociado a un autovector v, que podemos suponer, sin 
perdida de generalidad, que satisface que 

n 

5EN = 1 

i— 1 

Entonces 

n n n n 

i < iai = iai 53 \ Vi \ = 53 i(Av)ii = 53 i(Av)ii = 53 

2=1 2 = 1 2=1 2=1 


n 

53 a ij v j 

3 =1 


Em =E E 1 


Vi 


= En = 1 


*=i \j =i 


3=1 M= 1 


3=1 


pues las columnas de A surnan uno y los elementos a^- son positivos. 

(n) Puesto que las columnas de A suman uno, si e = (1,..., 1) se tiene que 
e T A = e T . Trasponiendo esta expresion: A T e = e, por tanto e es un 
autovector de A T asociado al autovalor 1. Puesto que una matriz y su 
traspuesta tienen los mismos autovalores, se tiene el resultado. 



Un vector v se dice vector de probabilidad si sus componentes son todas no 
negativas y suman uno. 


En la demostracion de (i) de la Proposition 7.3 se demuestra implicitamente 
el siguiente resultado: 
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Si A es una matriz de Markov y v un vector de probabilidad, entonces Av 
tambien es un vector de probabilidad. 


El significado de este resultado es el siguiente: en un proceso de Markov, 
“no se gana ni se pierde nada”, es decir, la cantidad total que hay al inicio 
permanece constante durante todo el proceso. 



Se denomina vector estacionario o de equilibria de una matriz de Markov a 
todo vector de probabilidad v tal que Av = v. 


En particular, los vectores de equilibrio de una matriz de Markov son los 
autovectores asociados al autovalor 1. 


Ejemplo 7.5 (continuation del ejemplo 7.4) 


El sistema (7.3) se representa en forma matricial por Xfc + i = Ax k , donde 

/ x k \ / 0.8 0.2 

= </ fc A= 0.1 0.7 

\z k J \0.1 0.1 

de modo que x k = ti fc Xo- Supongamos que el dato inicial es (xo,yo,zo) = 
(0.2, 0.3, 0.5), es decir, que inicialmente, hay un 20% de la poblacion que va al 
supermercado X, un 30% va al Y y un 50% va al Z. Tratemos de averiguar 
la tendencia del mercado, es decir, que porcentaje de poblacion acudira a cada 
uno de los supermercados pasado un cierto tiernpo. 

Teniendo en cuenta que los autovalores de A son 1, 0.6 y 0.5 se tendra que 
la solution general del sistema vendra dada por 

x fc = C 1 +C 2 (0.6) fe + C 3 (0.5) fe 

Dado que esto es un sistema tridimensional, la solution general debera depender 
de tres constantes, y no de nueve como indica la aparicion de los vectores (%. 
Podriamos proceder de forma similar a los ejemplos de sistemas de ecuaciones 
en diferencias que hemos tratado, imponiendo en este caso dos de las ecuaciones 
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En el ejemplo anterior hemos usado que si v es un autovector de A asociado 
a un autovalor A, entonces v es un autovector de A k asociado al autovalor A fc , 
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es decir, 

tiv = Av =>■ A k v = A fc v 

Por otro lado, los calculos realizados son validos en cualquier situation, es decir, 
aqui no se ha usado que la matriz es de Markov. 

Mas aun, en este caso concreto debemos observar que nos hubiera sobrado 
con calcular el autovector asociado al autovalor 1, pues en el estado limite, los 
autovectores asociados a autovalores menores que uno desaparecen, por lo que 
el estado limite es un vector estacionario. 



Un raton se encuentra en un laberinto con 5 compartimentos que estan 
conectados entre si a traves de tuneles tal y como se representa en la siguiente 
figura. 



Se supone que cada vez que el raton deja un compartimento y elige un tunel 
que lo conecta, lo hace con igual probabilidad, y que en cada etapa, el raton 
siempre elige un tunel para moverse. Encontrar en que compartimento pasara 
el raton la mayor parte del tiempo, tras un periodo suficientemente largo. 

Segun la figura, la probabilidad de que el raton se mueva de un comparti¬ 
mento a otro en una determinada etapa vendra dada por la siguiente matriz: 


/o i I i 

w 2 5 3 

§000 

3 0 I I 

I 0 § 0 

V° 5 S § 


o\ 


1 

5 

1 

5 

1 

5 

2 

5 




donde el elemento de la fila i columna j representa la probabilidad de que el 
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raton vaya desde el compartimento j al i. 

(k) 

Denotando por x\ , a la probabilidad de que en la etapa k el raton este en 
el compartimento i, el estado del sistema vendra dado por x^ fe+1 l = Ax^ k \ 
Suponiendo que el raton se encuentra en el estado inicial en cualquiera de 
los compartimentos con igual probabilidad, es decir, el estado inicial = 
(|, i, |) veamos cual es el estado limite. 

Puesto que se trata de un proceso de Markov, todos los estados asociados a 
autovalores menores que uno desparecera en el lmrite, por lo que solo hemos de 
preocuparnos por los estados estacionarios, es decir, los autovectores asociados 
al autovalor 1. 

Si calculamos kcr(A — I) se obtiene como autovector independiente v = 
(3,2,5,3,5), de modo que x ^ = A k x^ = cv, donde c es una constante 
que determinamos observando que el resultado tiene que ser un vector de 
probabilidad (segun la Proposition 7.4). Asi, la suma de sus elementos debe ser 
uno y por tanto c = ^ . El estado limite corresponde al vector (A, A|, |, A|), 

lo que significa que pasara el mayor tiempo en los compartimentos 3 y 5. 


□ B - 

APLICACION: MODELOS BIOLOGICOS 

Un ejemplo tipico de aplicacion de los sistemas dinamicos en Biologia aparece 
en los modelos de evolution de dos especies competidoras que interactuan unas 
con otras, como los modelos depredador-presa. 

De manera simplificada se suele suponer que el crecimiento de una determi- 
nada especie de presas (altamente reproductoras, como por ejemplo, los conejos) 
en ausencia de depredadores crece segun la ecuacion 

x k +i u ^ 1 

donde Xk denota el nurnero de presas en un instante temporal fc, y a es un 
parametro que estima la tasa de reproduction de la especie. Notese que al ser 
a > 1, el nurnero de individuos de este especie crece en cada etapa de tiempo. 
Por otra parte, el crecimiento de los depredadores en ausencia de presas (y por 
tanto sin alimento) es negativo, modelandose por 

y k +i = dy k , 0 < d < 1 

La interaction de ambas especies nos lleva a un sistema como el siguiente 


x k+ i = ax k - by k 
y k +i = dy k + cx k 
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en el que los parametros bye miden la influencia que cada especie tiene en 
el crecimiento de poblacion de la otra. Asi, b > 0 indica que la presencia de 
depredadores disminuye la poblacion de presas, mientras que c > 0 significa 
que la cantidad de presas (es decir, de alimento) incrementa el numero de 
depredadores. El sistema anterior admite una representacion matricial del tipo 



que no es mas que un sistema de ecuaciones en diferencias de orden uno. 
Veamoslo con mas detenimiento a traves de un ejemplo concreto: 

Consideremos una poblacion de zorros en una region de un bosque cuyo 
alimento preferido son los conejos. Denotemos por Z k y C k al numero de 
individuos (en miles) de cada especie medidos en un perfodo de tiempo k. y 
supongamos que la evolucion de las dos poblaciones obedece a las ecuaciones 
siguientes: 


Z k+1 = 0.5Z k +0AC k 
Cfc+i = —pZ k + 1.1 c k 


donde p es un parametro positivo a especificar. Como vemos, en ausencia de 
conejos, la poblacion de zorros se divide por la mitad en cada etapa temporal, 
mientras que en ausencia de zorros, la poblacion de conejos aumenta un 10 % 
en cada etapa. Sin embargo, la aparicion de conejos incrementa la poblacion de 
zorros, mientras que la existencia de zorros hace que la poblacion de conejos 
disminuya. 

Imaginemos en primer lugar que el parametro p = 0.2, y veamos cual es 
la evolucion de las poblaciones a largo plazo. En este caso el sistema dinamico 
queda: 




0.5 0.4 


-0.2 1.1 


Vamos a usar Python para realizar los calculos de autovalores y autovectores: 


1 >>> from sympy import Matrix 

2 >>> a=Matrix([[0.5,0.4],[-0.2,l.l]]) 

3 >>> a.eigenvects() 

4 [(0.700000000000000, 1, [[2.0] 

s [ 1]]), (0.900000000000000, 1, [[1.0] 

e [ 1]])] 


Esto es, los autovalores y autovectores asociados son: 

0.7 -t(2,l) 0.9 ->(1,1) 
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^Que significado tiene el resultado? Teniendo en cuenta que los autovalores 
son 0.7 y 0.9, el sistema tendera a algo del estilo 

6) =ai(o7) ‘ +aj(o ' 9) ‘^(o) 


Es decir, para el valor de p = 0.2, las dos especies se extinguiran. Es facil intuir 
el por que: la voracidad de los zorros hace que la poblacion de conejos se extinga 
y posteriormente, al quedarse sin alimento, desaparecen tambien los zorros. 

La pregunta ahora serfa, cuanto debe valer p para que se nrantengan cons- 
tantes ambas poblaciones. Si los autovalores son menores que uno, acabamos de 
ver que ambas poblaciones estan condenadas a la extincion; si ambos son ma- 
yores que uno, las poblaciones se disparan, es decir ambas poblaciones crecen 
indefinidamente (lo que desde un punto de vista realista no tiene sentido, pues 
los recursos son limitados, pero este es un efecto que no estamos considerando 
en el sistema). Por otro lado, si un autovalor es mayor que uno y el otro menor 
que uno, en funcion del dato inicial se tendria que las poblaciones pueden crecer 
o extinguirse. Se observa que la unica forma de llegar al equilibrio es que alguno 
de los autovalores sea igual a uno. 


1 

>>> from sympy import Matrix,symbols,eye,solve 

2 

>>> p=symbols(’p’) 

3 

>>> a = Matrix([[0.5,0.4] , [-p,l.l]]) 

4 

>>> b = a-eye (2) 

5 

>>> b.det () 

6 

-0.05 + 0.4*p 

7 

>>> solve (_) 

8 

[0.125000000000000] 

9 

>>> a.subs(p,0.125) .eigenvals () 

10 

{0.600000000000000: 1, 1.00000000000000: 1} 


luego 


0.5-1 0.4 

-p 1.1-1 


-0.04 + OAp = 0 => p = 0.125 


Es decir, para p = 0.125 los autovalores son 1 y 0.6. 

Observese el uso del guion bajo para reutilizar la ultima salida en Python 
(linea 7) y el modulo subs (linea 9) para sustituir el valor de p en la matriz y 
luego calcular los autovalores. 

Para el valor de p = 0.125 aseguramos que uno de los autovalores es 1 y el 
otro es menor que uno, de forma que el vector asociado al autovalor 1 nos dara 
estados en los que la poblacion se mantiene constante. Si intentamos obtener el 
autovector asociado al autovalor 1: 

11 
12 
13 


>>> a.subs(p,0.125). eigenvect s ( ) 
[(0.600000000000000, 1, [[4.0] 

[ 1 ]]), ( 1 . 00000000000000 , 1 , [])] 
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nos encontramos con que Python no es capaz de proporcionarlo, posiblemente 
por algun error de redondeo. 3 * En este caso hemos de calcularlo a mano, resul- 
tando el vector (4, 5). Es decir, si el estado initial es un multiplo de este vector, 
entonces ambas poblaciones se mantienen constantes. 

HI - 

EJERCICIOS 
Ejercicios de repaso 

I ail Resolver las siguientes ecuaciones en diferencias: 

(a) x n+2 - x n+1 - 2x n = 0, xi = 0, x 2 = 5 

(b) x n+2 - 5x n+ i + 6x n = 0, x\ = 1, x 2 = 2 

(c) x n+3 - 5x n+2 + 3a: n+ i + 9x n = 0 

(d) d~ 2x n j r2 “t - x n 0 


1*1 Se dan las sucesiones recurrentes 

u n = 3u n — i “b 3v n —i 
v n = 5u n -i + v n _i 

con ito = 1 y = 1- Hallar u n y v n en funcion de n. 

|2I Sea la sucesion (de Fibonacci) 0,1,1,2,3,5,8,13,... i.e. x n + 2 = x n +± + 
x n . Calcula el termino x n en funcion de n. 

121 Calcular, si es posible, el estado limite para el sistema cuya matriz es 

/ 0.9 0.15\ 

\0.1 0.85 ) 

|21 Estudiar la dinamica de un punto cuyas coordenadas en el instante n 
vienen dadas por las ecuaciones 

/ Xn\ f | 3 0 \ / X n -i\ 

[Vn = -2 0 y n _ i 

\ZnJ V " 6 " 6 -~J 


3 Este comportamiento, aunque anomalo, puede ocurrir en determinadas ocasiones debido 

a las limitaciones o posible errores del software. 
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Problemas 


m 


que 


Sea la sucesion 0,1, 2, 5,12,29,, i.e. x n = 2x n -\ + x n -2 . Demostrar 

(1 + 72)” (l — 72) ” 

Xn 272 272 


y usar el hecho de que x ™ +1 ~ 1 + 72 para aproximar 72. 


|3| Se sabe que la posicion de una parti'cula en el piano en el instante t > 0 
esta dada por 


/V\ /o.5 o\ |Vi\ 

w v 0 - 5 v U-J 


Estudiar la dinamica de dicha particula segun sea la posicion initial (cco, J/o) - 
|3il Los coches espanoles sin catalizador se dividen en tres grupos: Los que 
cada ano han de pasar la inspection tecnica de vehiculos (la ITV), los que aun 
son suficientemente nuevos como para no tener que pasarla y los que causan 
baja (van a la chatarra). Se sabe que el 2% de los coches nuevos tienen que 
pasar la ITV al ano siguiente y que el 3% de los que ya la pasaban causan 
baja. Se supone que ya no se fabrican coches sin catalizador y que por tanto el 
nurnero de coches sin catalizador es fijo. Si en el ano 95 hay 3000 coches que 
deben pasar revision y 15000 que todavia no, calcula cuantos aiios han de pasar 
para que se reduzca a la mitad la cantidad de coches que no tienen que pasar 
la ITV. 

|3] Un estudio realizado sobre la comunidad de ingenieros industriales revela 
el hecho siguiente: El 90 % de los hijos de padres ingenieros industriales cursan 
estudios de ingenieria industrial y solo el 20 % de los hijos de padres no ingenieros 
industriales cursan esa carrera. ^Cual sera el porcentaje de estudiantes que 
cursaran la carrera de ingenieria industrial despues de rnuchas generaciones? (se 
supondra un hijo como descendencia por cada familia). 

I ami El ascensor de un edificio con bajo y dos pisos realiza viajes de uno a 
otro piso. Se sabe que la mitad de los viajes que parten del bajo se dirigen a 
cada uno de los otros dos pisos, mientras que si un viaje comienza en el primer 
piso, solo el 25 % de las veces finaliza en el segundo. Por ultimo, si un trayecto 
comienza en el segundo piso, siempre finaliza en el bajo. ^Cual es la probabilidad 
de que, a largo plazo, el ascensor se encuentre en cada uno de los tres pisos? 
|3I Las familias de cierto pais se clasifican segun residan en areas rurales, 
urbanas o suburbanas. Los estudios de movilidad demografica estiman que, en 
promedio, en el curso de un ano, el 15 % de las familias urbanas cambia de 
residencia y se traslada a un area suburbana, y el 5 % a un area rural; mientras 
que el 6 % de las familias residentes en areas suburbanas se traslada a areas 
urbanas, y el 4% a areas rurales, y finalmente el 4% de las familias rurales 
migra a las areas urbanas y el 6 % a las suburbanas. Supongamos que en el 
momento actual el 40 % de las familias del pais viven en areas urbanas, el 35 % 
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en suburbanas y el 25 % en rurales. ^Que distribution de poblacion es de prever 
en el futuro si las tendencias no cambian? 


Ejercicios teoricos 

*OEl Se considera un sistema dinamico x^+i = Ax k con matriz A diagonali- 
zable. Se define el radio espectral de A, y se denota por p(A) como 

p(A) = max {|Ai|,|A 2 |,...,|A n |} 

l<i<n 

con Ai,..., A„ los autovalores de A. Probar: 

(a) Si p(A) < 1 entonces lfm x^ = 0, Vx 0 . 

k—t oo 

(b) Si p(A) = 1, existe algiin x 0 tal que lfm x k ^ 0. 

k—> oo 

| 2 JC| Probar que si A es un autovalor asociado a un autovector v de una 
matriz A £ Ad ra (IK), entonces X k es autovalor asociado a v de A k . 

|3U Sea A una matriz de Markov de orden 2x2 distinta de la identidad. 

(a) Probar que existen numeros ay b, con 0 < a, b < 1 tales que 

A = ( l ~ a b \ 

\ a 1-bJ 

(b) Compruebese que los vectores (6, a) y (1,-1) son autovectores de A. 

(c) Hallar la forma canonica de A y obtener una expresion de A k . 


Ejercicios adicionales 

Una hormiga se encuentra situada en el vertice 1 de la piramide truncada 
que aparece en la figura adjunta. 



7.6 ■ Ejercicios 


311 


Cada minuto que pasa, la hormiga se des- 
plaza exclusivamente por las aristas de la 
piramide hasta un vertice adyacente, eligien- 
do con igual probabilidad la arista por la que 
se mueve. Asi, por ejemplo, en el primer mi¬ 
nuto la hormiga se rnovera o al vertice 2, o al 
vertice 8, o al vertice 9, con probabilidad | en 
todos los casos. 

Rociamos con un spray insecticida los verti¬ 
ces 13 y 14 de la piramide, de manera que si la 
hormiga llega a cualquiera de estos dos vertices 
morira de inmediato. ^,Cual es la probabilidad 
de que la hormiga siga viva al cabo de 10 mi- 
nutos? lY tras una hora? Hay alguna posibilidad de que la hormiga sobreviva 
al cabo del tiernpo? 

Sugerencia: realizar los calculos con la ayuda de Python. 



>11 







8 Espacio vectorial euclideo 


□ a - 

PRODUCTO ESCALAR 

En este tema vamos a introducir una nueva operacion en un espacio vectorial, 
el producto escalar , que nos va a dar acceso a nuevas e interesantes posibilidades. 
Entre ellas, el producto escalar nos va a permitir introducir el concepto de 
longitud en un espacio vectorial, y gracias a este, podremos calcular distancias 
entre vectores e introducir una notion de proximidad que tiene importantes 
aplicaciones. 

La introduction de esta nueva operacion dota a los espacios vectoriales de 
una estructura nueva, denominada espacio euclideo, cuya definition damos a 
continuation. 



Sea E un espacio vectorial real. Una aplicacion 


(•,•): E x E —» R 
(x,y) —» (x,y) 

se dice que es un producto escalar si satisface las siguientes propiedades: 

(i) ( x ,y) = (y,x), Vx,y e E. 

(n) (x + y, z) = (x, z) + (y, z), Vx, y, z e E. 

(in) (ax,y) = a(x,y), Vx,y € E, Va £ R. 

(iv) (x, x) > 0, Vx G E. Ademas (x, x) = 0 <t=> x = 0. 

Si en un espacio vectorial E hay definido un producto escalar se dira que E 
es un espacio euclideo (e.e.). 


La propiedad (i) se denomina de simetria, (n) y (ill) son propiedades de 
linealidad , mientras que la propiedad (iv) se conoce como positividad. Notese 
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tambien que de (i)—(ill) se deduce 


(x, y + z) = (x,y) + (x,z) 
(x,ay) = a(x,y) 


Vx,y,z € E, Va£t 



Si E es un espacio vectorial complejo, tambien se puede dar una definition 
similar para lo que se conoce genericamente como producto interno. En este caso 
se trata de un aplicacion 


(-,•): ExE —» C 
(x,y) —> (x,y) 

que satisface (il)-(iv), y en la que (i) se sustituye por 

(x, y) = (y,x), Vx, y £ E 

En tal caso diremos que E es un espacio unitario. 


(i) En R n , la aplicacion 

n 

(x, y) = ^2 XiVi 

i=X 

es un producto escalar, que sera el producto escalar habitual que usaremos 
en este espacio. La notation habitual para el mismo es (x, y) = x • y, o en 
forma matricial, x T y. 

(n) En R (i) 2 , 

(x,y) = (xi 

es un producto escalar. 

(ill) C([a , b\) es un espacio euclideo con el producto 



(f,g)=[ f{x)g(x)dx 

J a 
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(iv) En R 2 , (x,y) = X\y\ no es un producto escalar puesto que no verifica 
la propiedad de positividad. Observese que, por ejemplo, x = (0,1) no la 
satisface, pues 

((0,1), (0,1)) = 0, pero (0,1) no es el vector nulo. 



n 

En C n , el producto interno habitual es (x, y) = ^ x, yl- 

i—1 


En todo lo que sigue consideraremos que E es un espacio vectorial real. 



Sea E un e.e. Se denomina norma o longitud de un vector x a \J (x, x). Se 
notara por ||x|j. 


La norma es un concepto fundamental, pues nos permite cuantificar o medir 
el tamano de un vector. Si un vector tiene norma proxima a cero, sera un vector 
pequeno, y viceversa. Gracias a esto, dos vectores son proximos si la norma de 
su diferencia es pequena (vease la seccion 3.3.2). 


El siguiente resultado es una desigualdad notable que relaciona las normas 
de dos vectores con su producto escalar. 


Proposicion 8.1 (Desigualdad de Schwarz 1 ) 


Si x, y G E , un e.e., entonces 

- 1 < (x ’ y) <1 

“ Nl • ||y|| - 


^^Tambien denominada desigualdad de Cauchy-Schwarz, aunque la formulacion y prueba 
que mostramos aqui se debe al aleman Hermann Klaus Hugo Weyl. 
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Demostracion: 

Sea A € R. La propiedad de positividad del producto escalar implica que 

(Ax — y, Ax — y) > 0, Vx, y £ E, VA € R. 

Desarrollando la expresion anterior haciendo uso de las propiedades de linealidad 
del producto escalar se tiene que 

A 2 (x, x) - 2A(x, y) + (y, y) > 0, VA e K 

Esta ultima expresion puede ser vista como un polinomio de segundo grado en 
A que, dado que es positivo, tendra a lo mas una rafz. Es decir, el discriminante 
de la ecuacion de segundo grado correspondiente debe ser menor o igual que 
cero. De este modo, 

4(x,y) 2 - 4||x|| 2 ||y|| 2 < 0 => < 1 

ll x lrl|y || 2 

de donde se sigue el resultado. 

■ 

Como consecuencia de la desigualdad de Schwarz obtenemos otras desigual- 
dades relevantes en la literatura matematica. 

Desigualdad de Cauchy: 

n / n \ V 2 / n \ V 2 

< ( ^x 2 ) (E^ 2 ) 

i =1 \*=1 / \*=1 / 

(que se obtiene al aplicar la desigualdad de Schwarz al producto escalar (i) del 
ejemplo 8.1). 

Desigualdad de Bunyakowski: 

' (J\g Or)) 2 ) ' 

(obtenida al aplicar el mismo resultado al producto escalar (in) del ejemplo 8.1). 

Estas desigualdades son diffciles de probar directamente, pero inmediatas 
gracias a la desigualdad de Schwartz. La siguiente desigualdad es clasica, y 
tambien se prueba usando la desigualdad de Schwartz. 


Proposicion 8.2 (Desigualdad triangular) 


Vx, y de un e.e. E, se verifica: 

ll x + y|| < IIx|| + ||y|| 
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Demostracion: 


l|x + y|| 


2 


(x + y, x + y) = ||x|| 2 + 2 (x, y) + ||y|| 


2 


(Des. Schwartz) < ||x|| 2 + 2||x|| • ||y|| + ||y|| 2 = (||x|| 2 + ||y|| 2 ) 


de donde se sigue el resultado. 



En la section 3.3.2 definimos una norma como un aplicacion verificando 
(i) ||x|| > 0, y ||x|| = 0 si y solo si x = 0. 

(ii) ||Ax|| = |A|||x||, VAeK. 

(m) ||x + y|| < ||x|| + ||y||. 


Las dos primeras propiedades son consecuencia inmediata de la Definicion 8.2 
y las propiedades del producto escalar, mientras que la tercera es precisamente 
la desigualdad triangular. Es decir, la norma dada en la Definicion 8.2 cumple 
con las propiedades anteriores. 


Matriz de un producto escalar 

Una vez mas, el hecho de trabajar en un espacio vectorial de dimension finita 
en el que existen bases nos permite acudir a las coordenadas para trabajar con 
los productos escalares. 

En concreto, si B = {ui,..., u„} es una base de£yx,y€£ sabemos que 


n 


n 



Entonces, por las propiedades de linealidad del producto escalar tenemos que 


( x > y ) = \ XiUi ’ 


i —1 3 — 1 


n 


n 





n 


x iVj ( u * i u t) 


*=1 3 =1 


n n 
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donde (Pb)^ = (u;,Uj), es la denominada matriz del producto escalar o matriz 
de Gram. 2 Debido a la simetria del producto escalar esta claro que la matriz Pg 
es simetrica. Notese tambien que para el producto escalar habitual Pb = I n - 
Dicho de otra forma, si conocemos la matriz de Gram respecto de una base, 
el producto escalar se convierte en una operation matricial que involucra las 
coordenadas de los vectores respecto de esa misma base. 


Consideremos el espacio euclideo de polinomios de grado rnenor o igual 
con coeficientes reales dotado del producto escalar 


(p{t),q{t)) = J p(t)q(t) dt 


La matriz de este producto escalar respecto de la base canonica B c = {1 , t,t 2 } 
se calcula: 


(1,1) =J ldt = 2, <1 ,t) 
(t,t) = J t 2 dt = |, (t,t 2 ) 


tdt = 0, 


i-i 
r 1 


t 3 dt = 0, 



es decir 



Veamos corno usar esta matriz. Supongamos cjue queremos calcular el pro¬ 
ducto escalar de dos vectores de Pj|, por ejemplo, 1 + 2 1 2 y 1 — 3 t — t 2 . Podemos 
usar la definition del producto escalar: 


(l+2t 2 ,1—3t—t 2 ) = J (l+2f 2 )(l—3t—f 2 ) dt = J (1—3t+t 2 —6t 3 —2t 4 ) dt = 


28 

15 


pero tambien podemos usar las coordenadas de estos vectores en una determi- 
nada base y la matriz de Gram del producto escalar respecto de esa misma base. 
En este caso quedaria: 


(1 + 2f 2 ,1 — 3t — f 2 ) 



0 

2 

3 

0 




28 

15 


2 Recibe su nombre del matematico danes J0rgen Pedersen Gram. 
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□ a - 

ORTOGONALIDAD 


La section anterior nos ha mostrado que es un producto escalar, la definition 
de norma y algunas propiedades interesantes; pero sin duda alguna, el concepto 
fundamental vinculado al producto escalar es el de ortogonalidad. 



Sea E un e.e. 


(i) Dos vectores x e y se dicen ortogonales respecto de un producto escalar 
si (x, y) = 0. Se notara x _L y. 

(n) Un conjunto de vectores {xi,...,x„} se dice ortogonal (dos a dos) si 
(xi.Xj) = 0 si i ± j. 

(ill) Un vector x es ortogonal a un conjunto S si (x, y) = 0, Vy G S. 



(i) Si consideramos en R 2 un vector x = (a, /3), entonces el vector y = (— (3, a) 
es ortogonal a x, pues 

x • y = (a, 0) • (-/3, a) = -a/3 + /3a = 0 

(n) Si consideramos R" con el producto escalar, la base canonica es un con¬ 
junto ortogonal. 

(ill) En C([—7r,7r]) con el producto escalar 

(f,9)=[ f{x)g{x)dx 
J — 7V 

el conjunto {sen(rnir),cos(na;)} mi „gN es ortogonal (dos a dos). 


Cuando tratamos con vectores de R 2 o R 3 y el producto escalar habitual, 
la ortogonalidad coincide con el concepto de perpendicularidad que el lector 
probablemente conocera. Sin embargo, el concepto de ortogonalidad es mucho 
mas amplio y puede establecerse en cualquier espacio euclideo, por ejemplo, 
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en un espacio de funciones. El concepto de funciones ortogonales (o incluso el 
de polinomios ortogonales) tiene importantes e interesantes aplicaciones que se 
escapan fuera del alcance de este texto. 

Una consecuencia inmediata de la ortogonalidad es la independencia lineal: 



Si xi,... ,x„ son ortogonales entre si y no nulos entonces son l.i. 


Demostracion: 

Veamos que la combination lineal nula de estos vectores, 

oqxi H-1- a n x n = 0 

implica que los escalares deben ser nulos. Haciendo el producto escalar para 
cada uno de los vectores x ? se tiene 

(aiXi - \-a n x n ,Xj) = (0 ,Xj) = 0 

Y usando la linealidad, 

ai(x 1 , Xj) H-[- a„(x„, Xj) = 0 => aj(xj, x^) = 0 => ctj = 0, V) 

Notese que es fundamental que ninguno de los vectores sea nulo. 

■ 

Otra consecuencia de la ortogonalidad es la siguiente version del Teorema 
de Pitagoras: 


Proposition 8.4 (Teorema de Pitagoras) 


Si x _L y entonces 

ll x + y || 2 = ||x|| 2 + ||y|| 2 


La demostracion se propone como ejercicio al lector. En la figura 8.1 repre- 
sentamos el resultado en el contexto de vectores en un piano. La suma de dos 
vectores ortogonales corresponde a un vector que coincide con la hipotenusa 
del triangulo rectangulo que forman, mientras que las normas corresponden a 
las longitudes de los mismos; es decir, en un triangulo rectangulo, la suma de 
los cuadrados de las longitudes de los lados ortogonales es igual al cuadrado 
de la longitud de la hipotenusa, esto es, el enunciado clasico del Teorema de 
Pitagoras. 
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Figura 8.1: Ilustracion del Teorema de Pitagoras 


□hi Bases ortonormales 

Un concepto habitual en los espacios euclldeos es el de base ortonormal. 



Se dice que una base B es ortogonal si los elementos que la forman son 
ortogonales dos a dos. Si ademas los vectores son de norma uno respecto del 
mismo producto escalar, se dira que B es ortonormal. 



En todo espacio euclideo de dimension finita existen bases ortonormales. 


La demostracion de este resultado es consecuencia inmediata del siguiente 
teorema. 
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Antes de pasar a la demostracion conviene entender bien lo que significa 
este resultado. Dado un conjunto de vectores linealmente independientes, es 
posible encontrar un nuevo conjunto de vectores que “generan lo mismo” que 
los vectores originales (propiedad (i)), y que ademas son ortogonales entre si, dos 
a dos (consecuencia de la propiedad (n)). Es decir, dado un conjunto de vectores, 
podemos ortogonalizar dicho conjunto, con vectores que son “esencialmente 
iguales”, en el sentido de que generan los mismos subespacios. 

Demostracion: 

La demostracion de este resultado es constructiva, es decir, nos dice como, a 
partir de un cierto conjunto de vectores, podemos construir un nuevo conjunto 
que genera lo mismo, y que son ortogonales. Dicho rnetodo es conocido como el 
metodo de ortogonalizacion de Gram-Schmidt. 

Para construir estos vectores, definimos inductivamente la sucesion de vec¬ 
tores y j del siguiente modo: 

yi = xi, y fc+ i = x fc+ i - ^2 ^ y j|y X p^ yj ’ para k - 1 t 8 - 1 ) 

Veamos en primer lugar que esta sucesion satisface (i), usando el principio 
de induction: 

■ Para k = 1 es evidente que L x = L{ yi). 

■ Supongamos ahora que L k = L(yi, • • •, yfc) y veamos que tambien se tiene 
el resultado para k + 1. Observese que de (8.1), y k +i = x fc+1 — v, con 
v £ L k (por hipotesis de induccion), luego y^+i £ L k +i- De aquf es 
evidente que L k+1 = L(yi,..., y/c+i). 

Probemos ahora (n), tambien por induccion. 

■ y 2 -L Li pues 

(y2,yi) = (x 2 ,Xi) - ^) (xi,xi) = 0 

■ Supongamos ahora que y k -L L k ~i y probemos que yfc+i es ortogonal a 
L k - Para ello debemos ver que (yfc+i,yj) =0, 1 < j < k. Entonces, 

/ \ / (yo x /c+i) \ 

(yfc+i.yj) = ( x fc+i - 2_, || y .|[2 y^yj) 

k 

= (Xfc+I.yj) - ^||y X |P^ 

3 El nombre se debe a J 0 rgen Gram y al ruso (nacido en la actual Estonia) Erhard Schmidt, 
aunque el resultado, ya usado por Cauchy en 1836, parece ser debido al frances Pierre-Simon 
Laplace. 
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Por hipotesis de induccion sabemos que (y,;, yj) = 0 si i ^ j, con 
1 < i,j < k; luego 

{yk+i,yj) = (xfc+i, yj) - (yj,x fc+ i) = o 


Veamos algunos ejemplos. 



(i) Consideremos el conjunto {(0,1, 2), (1,0,0), (0,1,1)}. Ortonormalizar res- 
pecto del producto escalar habitual en K 3 . 

Aplicamos el metodo de Gram-Schmidt del siguiente modo, 

yi = (0,1,2) 


Y 2 = X 2 - 


yi • x 2 

llyill 2 


yi = (i,o,o)- 


( 1 , 0 , 0 ) -( 0 , 1 , 2 ) 
! l ( 0 , l , 2)|| 2 


( 0 , 1 , 2 ) = ( 1 , 0 , 0 ) 


yi • x 3 y 2 • x 3 

y 3 ^3 || 11 o y 1 II 11 o y ^ 

llyilr Ily2|| 2 


(o, i , i ) - i , 2 ) - ( i a ^ i ) ( i , o, o) 


ll(0,l,2)||s 


11(1,0,0)112 


(0.! -s) 


As! pues, el conjunto {(0,1,2), (1,0,0), (0, —g)} es ortogonal. Notese 

que puesto que (0,1,2) y (1,0,0) ya son ortogonales, el metodo no los 
modifica. Por otro lado, es evidente que los subespacios 

L 1= L((0,1,2)), L 2 = L((0,1,2), (1,0,0)), 

L 3 =L(( 0,1,2), (1,0,0),(0, §,-!)) 

son los mismos que 

Li=L(( 0,1,2)), L 2 = L((0,1,2), (1,0,0)), 

L 3 = L((0,1,2), (1,0,0), (0,1,1)) 

Puesto que adernas, los vectores iniciales forman base de R 3 (son tres vec- 
tores independientes), podemos obtener una base ortonormal dividiendo 
cada uno de ellos por su norma: 

||(0,1,2)|| = \J (0, 1, 2) • (0,1, 2) = vT+4 = V5, ||(1,0,0)|| = 1, 

ii(o. §.-Dii = vT 
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Es decir, el conjunto {(0, ^g), (1,0, 0), (0, — t?)} es una base 

ortonormal de R 3 . 

(il) Ortonormalizar los vectores {1 ,t,t 2 ,t 3 } de Pr[ f] respecto del producto 
escalar 

(p, q) = J P(t)q(t) dt 

En el ejemplo anterior hemos acudido directamente a la expresion (8.1) que 
nos proporciona el metodo de Gram-Schmidt. Sin embargo, en la practica 
no es necesario conocer esta formula “de memoria”, sino observar como 
se construye cada nuevo elemento de la sucesion para ortogonalizar un 
conjunto cualquiera. Para el caso que nos ocupa, esta claro que el primer 
elemento de la nueva sucesion es el primer elemento que ya tenemos: 

yi = i 

Ahora, para calcular el siguiente elemento basta ver que se trata del 
elemento de la sucesion dada menos una combinacion lineal de todos los 
elementos que acabamos de construir. Asf, 


y 2 = x 2 - ayi 


con la condition de que (y 2 ,yi) = 0. Es decir, y 2 = t — a, siendo a tal 
que 

(t — a, 1) = J (t — a) dt = 0 => a = 0 

luego y 2 = t. Notese que puesto que xi = 1 y x 2 = t son ya ortogonales, 
el metodo Gram-Schmidt no modifica dichos vectores. 

Del mismo modo, y 3 se construye como y 3 = X 3 — aqyi — a 2 y 2 , con 
las condiciones adicionales (y 3 ,yi) = (y 3 ,y 2 ) = 0. Imponiendo ambas 
condiciones: 


{t 2 - ai - a 2 t, 1) 



— ai — a.21) dt = 0 


(t 2 — ai — a 2 t,t} = / (t 2 — ai — a 2 t)t dt = 0 


| - 2ai = 0 

— §a 2 = 0 


luego aq = | y a 2 = 0. Es decir, y 3 = t 2 — 

Finalmente, = t 3 — fii— fd 2 t—/3 3 (t 2 — |), con las condiciones (y 4 ,y j) = 0, 
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1 < j < 3, es decir 

( t 3 -Pi- Pit - P 3 (t 2 - |), 1 ) = J { t3 - Pi- fat - P 3 {t 2 - §)) dt = 0 

(t 3 - Pi - Pit - p 3 (t 2 - §),i) = J (t 3 - Pi - Pit - p 3 (t 2 - D) tdt = 0 

( t 3 - Pi - Pit- P 3 (t 2 - \),t 2 - \) 

= J (t 3 - Pi- Pit - p 3 (t 2 - §)) ((t 2 -\) dt = 0 

de donde se obtiene el sistema 

f -2ft = 0 

§-lA = o 

l -A^3 = 0 

cuyas soluciones son ,/3i = P 3 = 0, Pi = |. Asi pues, yi = t 3 — 1 1. Es 
importante observar que el calculo de las integrales anteriores se puede 
simplificar bastante si observamos que en diversos momentos estamos 
calculando integrales del tipo 

J (t 2 — |) dt = (1, t 2 — |) = 0 6 J t{t 2 — |) dt = (t, t 2 — |) = 0 

que son nulas debido a la ortogonalidad entre estos polinomios. 

Finalmente, el conjunto {1 ,t,t 2 — |,t 3 — 1 1} es ortogonal, y calculando 
sus normas: 



obtenemos el siguiente conjunto ortonormal: 

f 1 AE /45/J.2 _ 1\ /l75/q3 3 f \l 

tv^’Va^’V 8 ^ 3b V 8 b' j 

En particular, observese que con el producto escalar dado, la base canonica 
de Pj| no es ortonormal. 
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(i) Observese que en una base ortonormal B, la matriz del producto escalar 
Pb = I n - Reci'procamente, si la matriz de un producto escalar es la 
identidad, entonces la base es ortonormal. 

(il) Dada una base ortonormal B = {ui,..., u„}, las coordenadas de un vector 
x respecto de esta base son 


X B = ((x,Ui),...,(x,U n )) 


pues si x = 
tiene 


n 

multiplicando escalarmente por cada vector Uj se 

j=1 


( x - u i> 


E 


U, 


n 

'y x i ( u i I u j) = x j 

i=1 


(in) Si B es una base de un e.e., Pb la matriz del producto escalar y B' = 
{ii!,..., u n } es una base ortonormal respecto del producto escalar, en¬ 
tonces la matriz A cuyas columnas corresponden a las coordenadas de los 
vectores U; respecto de la base B verifrca que A T PbA = I n . 

En particular, si consideramos el producto escalar habitual en R n y la 
base canonica, cualquier matriz A cuyas columnas correspondan a las 
coordenadas (canonicas) de los vectores de una base ortonormal verifica 
que A T A = I n . Esto motiva la siguiente definition. 



Se dice que una matriz A € A^ n (K) es ortogonal si A T A = I n , o equivalen- 
temente, A T = A~ x 


□ BI3 Subespacios ortogonales 


El concepto de ortogonalidad puede ser extendido tambien a subespacios: 
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— ^ - 

Dos subespacios Wi, W-j se dicen ortogonales, y se notara W\ J_ W 2 , si todos 
los vectores de W\ son ortogonales a todos los vectores de W 2 . 


Como es habitual en los espacios vectoriales, lo que sucede con una base es 
extensible a todo el subespacio. 



W\ _L W 2 si y solo si los vectores de una base de W\ son ortogonales a los 
vectores de una base de W 2 . 


Demostracion: 

La implication hacia la derecha es trivial. Veamos la implication contraria. Sea 
{ui,..., u„} una base de W\ y {vi,..., v m } una base de W 2 , de forma que los 
elementos de la base de W\ son ortogonales a los elementos de la base de W 2 . 
Consideremos ahora x £ W\ e y £ W 2 - Por la condition de base, 

n m 

x = ^z i u i , y = J2yjVj 

i =1 1 

Entonces, de la linealidad del producto escalar 

n m 

( x ,y) =J2^2x i y j {u i ,v j ) = 0 

i=i j =1 

pues (ui, v i) = 0 V-i, j, de modo que x _L y. De la arbitrariedad de los vectores 
se obtiene el resultado. 



Wx J_ W 2 => Wi n W 2 = { 0 }. 


Demostracion: 

Esta claro que si x £ W\ fl W 2 , dado que W\ _L W 2 se debe tener que (x.x) = 0, 
de lo que se deduce que x = 0. 
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Sea W un subespacio vectorial de un e.e. E. Se define el ortogonal de W, 
tambien denominado complemento ortogonal de W, y se notara por W^, como 

W- 1 = {y G E : x i y, Vx G W} 


Es decir, el complemento ortogonal de un conjunto W esta formado por los 
vectores que son ortogonales (simultaneamente) a todos los vectores de W. 



W 1 - es un subespacio vectorial. 


La demostracion se propone como ejercicio al lector. 



( W ± ) ± = W. 


Demostracion: 

Sea x G W. Entonces si y € W^ entonces x J_ y, es decir, x G ( W - L )- L . De aqui 
se concluye que W C (IE- 1 )- 1 -. 

Reciprocamente, si x G ( W - L )- L entonces x _!_ y para todo y G . Esto 
es, x G W, lo que implica que ( W - L )- L C W. De la doble inclusion se obtiene el 
result ado deseado. 


Calculo del ortogonal a un subespacio 

La Proposition 8.5 nos indica que para obtener la ortogonalidad a un 
subespacio, basta trabajar con una base del subespacio. Esta es la idea central 
para obtener el ortogonal de un subespacio. 

De forma general podemos afirmar que si W tiene una base formada por 
los vectores {ui,..., u„}, entonces W L viene dado por el sistema de ecuaciones 
implfcitas 

(x,ur) =0, ..., (x,u„) = 0 

Es mas, si usamos el producto escalar habitual de K", y {ui,...,u„} es una 
base de W, entonces, la matriz cuyas filas estan formadas por las coordenadas 
















8.2 ■ Ortogonalidad 


329 


de los vectores de la base corresponde a la matriz de un sistema de ecuaciones 
implfcitas que define a W 1 -. 



(i) Para encontrar el ortogonal de W = L((l, 1, 0), (0,0,1)) respecto al pro- 
ducto escalar habitual de R 3 bastara imponer ortogonalidad respecto a la 
base de W: 

xi ( 1 , 1 , 0 ), x± ( 0 , 0 , 1 ) 

Si ponemos x = (x\, X 2 , £ 3 ) entonces el requerimiento anterior nos lleva al 
sistema 

Xi+x 2 = 0 1 

x 3 = 0 J 

que resulta un sistema de ecuaciones implfcitas de . Resolviendo dicho 
sistema encontramos una base de W - 1 ; en este caso W 1 - = L((l,—1,0)). 
Notese que la matriz del sistema de ecuaciones que define a W 1 - es 

a-(' 1 
V° 0 V 

cuyas filas corresponden a las coordenadas de los vectores de la base de 

W. 

( 11 ) Encontrar el ortogonal de W = {x G M 3 : X\ + 2x2 — x 3 = 0}. 

En una primera aproximacion, para calcular W procederfamos como 
en ( 1 ), es decir, calcularfamos una base de W (resolviendo el sistema) y 
posteriormente la emplearfamos para construir un sistema de ecuaciones 
implfcitas de . Sin embargo es mas sencillo prestar atencion al hecho 
de que x e W si satisface la ecuacion 

Xi + 2x 2 - x 3 = 0 0 (xi,x 2 ,x 3 ) ■ (1,2, -1) = 0 

Es decir, todos los vectores de W deben ser ortogonales a (1,2,—1), de 
manera que este vector forma una base de . 

Atendiendo a este ultimo ejemplo, si estamos usando el producto escalar 
habitual en R" y tenemos un subespacio W generado por las soluciones 
del sistema homogeneo Ax = 0 , entonces una base de W 1 - estara formada 
por los vectores cuyas coordenadas corresponden a las filas de la matriz 

A. 
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Si estamos usando un producto escalar distinto, cuya matriz respecto de la 
base con la que trabajemos es Pg, entonces la matriz APg, donde A es la matriz 
cuyas filas estan formadas por las coordenadas respecto de la base B de los 
vectores de la base de W, es la matriz de un sistenra de ecuaciones implicitas 
que define a W 2 -. 



Calculemos ahora el subespacio ortogonal a W = L ({2 + t, 1 — t 2 }) en Pj|. 
Dado que la base de W esta formada por los polinomios 2 + t y 1 — t 2 , una 
primera opcion para obtener seria obtener los polinomios x 3 + x 2 t + x 3 t 2 
tales que 


(xi + x 2 t + x 3 t 2 ,2 + 1) = 0, (xi + x 2 t + x 3 t 2 ,1 - t 2 ) = 0 


es decir, 



(1 + x 2 t + x 3 t 2 ){2 + t)dt = 4xi + ^x 2 + |cc 3 = 0 


{xi + x 2 t + x 3 t 2 )( 1 - t 2 ) dt = |xi + j^x 3 = 0 


cuya solucion es (1,4, —5), que corresponde al polinomio 1 + At — 5t 2 . 

En lugar de calcular los productos escalares mediante integrales, podemos 
hacer uso de la matriz de Gram de este producto escalar respecto de la base 
canonica, ya obtenida en el ejemplo 8.2. En tal caso, W 1 - viene dado por un 
sistema de ecuaciones lronrogeneo cuya matriz es 



que obviamente coincide con el obtenido anteriormente. 


HH JJ Proyeccion ortogonal 


Una vez introducido el concepto de complemento ortogonal de un subespacio, 
vamos a probar un resultado que nos permitira definir la proyeccion ortogonal. 
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Si W es un subespacio vectorial de un e.e. E, entonces W ® W 1 - = E. 


Demostracion: 

Por la Proposicion 8.6 ya sabemos que W n W- 1 = {0}. Veamos ahora que 
W + W 1 - = E. 

Consideramos una base de W, {ui,... u„} y la completamos hasta obtener 
una base de E que posteriormente ortogonalizamos mediante el metodo de 
Gram-Schmidt. De este rnodo tenemos una base ortogonal formada por unos 
vectores {vi,..., v„, v n +i,..., v m } tales que L(ui,... ,u„) = L(vi,..., v n ) = 

W. 

Esta claro que si z £ E, entonces 

m 

■ = £ ZiVi 
2=1 

Obviamente x G W. Por otro lado, y _L v^, 1 < i < n, pues 

/ m \ m 

(y> v i) = ( ~j v .i ' v ' ) = H z i ( v ji v ») = °> i = l,---n 

\j—n+l / j=n +1 

de rnodo que y G W L (pues es ortogonal a una base de W). Es decir, hemos 
escrito un vector cualquiera de E como suma de uno de W mas otro de W 1 -, lo 
cual significa que E = W + W 1 -. Esto concluye la prueba. 

■ 

Observese que como consecuencia de este resultado todo vector x G E puede 
escribirse de forma unica (recuerdese el Teorema 4.13) como 

x = y + z, con y G W y z G W^ 


n m 

= E- V *+ E z ^j = x + y 

2=1 j=n -\-1 



Con las notaciones anteriores se dice que y es la proyeccion ortogonal de 
x sobre W, que denotaremos por Vw( x ) = y. Asimismo, se dice que z es la 
proyeccion ortogonal sobre W que denotaremos por Qw( x ) = z. 


La figura 8.2 ilustra la tipica proyeccion de un vector sobre un piano vectorial 
W. Descomponemos el vector x en suma de un vector de W, el vector y, mas 
otro vector del ortogonal de W (que en este caso es la recta perpendicular a 
W), z, de tal forma que x = y + z. La proyeccion ortogonal sobre W es en este 
caso el vector y. 
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z 


x 


Figura 8.2: Proyeccion sobre un piano 


Calculo de la proyeccion ortogonal a un subespacio 

Procedamos ahora a calcular la proyeccion ortogonal de un vector x sobre 
un subespacio W. 

Dada una base de W, {ei,..., e,.}, sabemos que la proyeccion ortogonal de 
un vector x £ E es un vector y £ W, de manera que y = ^[ =1 donde A* 
son escalares que vamos a determinar. 

Por otra parte, como x = y + z con z £ W ± , eso significa que x — y £ W 1 -. 
Es decir, el vector z = x — y, conocido como el error* es ortogonal a W. Por 
tanto debe ser ortogonal a su base, es decir 



( 8 . 2 ) 


De este modo, (8.2) es un sistema de r ecuaciones con r incognitas (Ai,... A r ) 
a partir del cual obtenemos los escalares que nos determinan la proyeccion. 



(i) Determinar la proyeccion del vector x = (0, —2,1) sobre W = L(( 1,1,0)). 

Denotando por Vw{ x) al vector buscado, esta claro que Vw(x) debe 
pertenecer al subespacio W, de modo que Vw( x ) = A(l, 1,0). Por otra 
parte, el error (0, —2,1) — A(l, 1,0) debe ser ortogonal a W, de manera 
que 


((0, —2,1) — A(l, 1,0)) ■ (1,1,0) = 0 


^ (0, -2,1) • (1,1,0) - A(l, 1,0) • (1,1,0) = 0 


4 Se denomina asf pues es la diferencia entre el vector y su proyeccion. 
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de lo que se deduce que A = — 1 y la proyeccion buscada sera Vw( x ) = 

(n) Determinar la proyeccion ortogonal del vector t 2 respecto del subespacio 
W = L({l,t}) enPg, dotado del producto escalar 

(P, o) = J P(t)q(t) dt 


A1 igual que antes, la proyeccion Vw(t 2 ) debe ser un vector de W es decir, 
sera de la forma Ai • 1 + A 2 1. El vector error, esto es 

Qw{t 2 ) = t 2 — Ai — A 2 1 

estara en W 2 -, por tanto sera ortogonal a una base de W. De este modo, 

= . f -«)■'* = » 

{i 2 -Ai-A 2 t,t)=0 j'y_ Xlt _ Me)it = a 

de donde se obtiene el sistema 


§ - 2Ai = 0 

-|a 2 = 0 


=>■ Ai = -, A 2 = 0 


As! pues la proyeccion ortogonal es Vw{t 2 ) = v 
(ill) Calculemos la proyeccion del vector x = (0,1,1) sobre el subespacio 

W = L{(0, 1,0), (0,0,1)) 


Siguiendo los ejemplos anteriores buscamos un vector Vw{ x) £ W, es 
decir, Vw{*) = Ai(0,1,0) + A2(0,0,1) que ademas verifica 


x-'P(x) ± W=> 


((0,1,1) - Ai(0,1,0) - A 2 (0,0,1)) • (0,1,0) = 0 
((0,1,1) - Ar(0,1,0) - A 2 (0,0,1)) • (0,0,1) = 0 


de donde obtenemos el sistema 1 — Ai = 0, 1 — A 2 = 0. luego el vector 
buscado es Vw( x ) = (0,1,1). 
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De (in) del ejemplo anterior podemos extraer dos consecuencias importantes. 

(i) La proyeccion de un vector x sobre un subespacio W cuando x G W es el 
propio vector x. Esto es evidente pues la unica forma de escribir x como 
suma de un vector de W mas otro de W 1 - es x = x + 0. 

(il) Si {ei,.. . e r } es una base ortogonal de W, la proyeccion ortogonal es 
mas facil de calcular, puesto que el sistema dado en (8.2) se puede escribir 


r 



i= 1 


Teniendo en cuenta que (e*, e^) = 0 si * ^ j, entonces 


A los A j se les denomina componentes de la proyeccion en la direccion , 
pues la proyeccion resulta 





Matriz de proyeccion 

Una forma alternativa de calcular la proyeccion de un vector x sobre un 
subespacio W generado por unos vectores ei,..., e*, (que supondremos indepen- 
dientes) consiste en lo siguiente: siempre podemos considerar que el subespacio 
W coincide con el subespacio imagen de una cierta aplicacion de matriz A. Bas- 
tara para ello considerar la matriz A como aquella cuyas columnas corresponden 
a las coordenadas de los vectores que conforman una base de W. Dicho de otro 
modo, W = Im(A). 

Nuevamente, buscar la proyeccion supondra encontrar un vector de W, es 
decir, en este caso, un vector de Irn(A). Asi pues, Vwi. x ) = AA, para algun 
vector A. Atendiendo al producto de matrices, podemos ver las componentes del 
vector A como los escalares de la combination lineal que define a la proyeccion. 

Por otra parte sabemos que (x — AA) _L W, es decir, que el producto escalar 
de x — AX con cualquier vector de la base de W es cero. Si estamos usando el 
producto escalar habitual en R" es facil darse cuenta que podemos representar 
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todos estos productos escalares simultaneamente escribiendo 

A T (x-AA) =O^A t A\ = A t x (8.3) 

Si los vectores que generan W, esto es, las columnas de A , son independientes, 
se tiene que la matriz A T A es invertible. 5 Asi pues A = (A T A) _1 A T x y dado 
que Vw{ x ) = A\ tenemos una expresion de la proyeccion que resulta 

Vw(x) = A(A t A)~ * 1 2 A t x (8.4) 

A la matriz A(A T A)~ 1 A T se le conoce como matriz de proyeccion. 

Si por el contrario, A T A no es invertible, entonces hemos de resolver el 
sistema dado en (8.3) para obtener A. ^Puede el lector averiguar por que este 
sistema tiene solution? 



Si el producto escalar no es el habitual, entonces hemos de usar la matriz de 
Gram, resultando que 


(x - AX) _L W => A t P b (x - AX) = 0 => P ff (x) = A(A T P B A)~ 1 A T P B x 


Calculemos la matriz de proyeccion sobre el subespacio 
W = L(( 1,2,-1),(1,0,-1)) 

Si consideramos la matriz 

1 1 
A=( 2 0 

entonces es evidente que W = Im(A). Segun (8.4), la matrix de la proyeccion 
sobre W vendra dada por 


A(A L A)~ L A = 



1 o -i 

2 u 2 

0 1 
-I 0 


5 De hecho se tiene que rango(A) = rango(A T A). Notese que A £ A4 nX r( K) con rango(A) = 
r < n y A T A E Alrxr(K). Si consideramos x E ker (A T A) entonces A T Ax = 0, de donde se 
deduce que x T • (A T Ax) = 0, o lo que es igual (Ax) T • (Ax) = 0, es decir Ax = 0, y por tanto 
x E ker (A). Con esto se prueba que ker(A T A) C ker(A). La inclusion contraria es evidente, y 
como ambos espacios coinciden, logicamente tambien los rangos de ambas matrices. 
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Finalmente damos una propiedad esencial de la proyeccion que aplicaremos 
en la siguiente seccion. 


Proposicion 8.10 


Si E es un e.e., W un subespacio vectorial de E y x £ E con x = X! + x 2 
tal que xi £ W, entonces ||Qw( x )ll < ||x 2 ||. 


Demostracion: 

De la hipotesis del resultado es evidente que x 2 = x — xi, de modo que 
||x 2 || 2 = ||x - Xl || 2 = \[Pw(x) + Qw(*) - Xl || 2 
y usando el Teorema de Pitagoras (pues ?iv(x) — xj £ W y Qw{ x ) £ W- 1 ) 
= \\V w (x)- Xl \\ 2 + \\Q w ( X )\\ 2 >\\Q w tx)\\ 2 


Es interesante prestar atencion a este resultado, pues afirma que dada 
cualquier descomposicion de un vector x en una surna X! + x 2 donde xj £ W, 
entonces el error entre x y su proyeccion ortogonal, esto es el vector Qvv(x) 
es siempre mas pequeno, en norma, que x — xi. La figura 8.3 trata de ilustrar 
este hecho. Por simplicidad hemos considerado W una recta vectorial (punteada 
en el dibujo). Las dos primeras figuras muestran descomposiciones del vector x 
en suma de un elemento de W, x-|, mas otro vector x 2 . La tercera, muestra la 
descomposicion correspondiente a la proyeccion ortogonal sobre W. Podemos 
apreciar que las longitudes de los vectores x 2 siempre seran mayores que las 
de Qw(x). 
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w 



(b) x = xi + x 2 



W 


Figura 8.3: Ilustracion de la Proposition 8.10 


La consecuencia de este resultado es la siguiente: Vw( x ), esto es la proyeccion 
ortogonal respecto de un subespacio W, es la mejor approximation a x que 
podemos encontrar en W. Dicho de otra forma, la proyeccion de un vector x 
sobre W es el vector de W que esta mas cerca a x de entre todos los que hay en 
W. El concepto de proximidad viene dado en funcion de la norma que induce 
el producto escalar en el que estemos trabajando. Por tanto se tiene que 

Vw( x ) es la solution del problema mm ||x — y|| (8.5) 

yew 



Encontrar la mejor aproximacion a la funcion 


f(x) 


— 1 si —7T < x < 0, 
1 si 0 < x < 7r, 


en los subespacios = L({sen(na:),cos(na;)}), n < 0,1,2de C([0,7r]) 
con el producto escalar 


(f,9) 


f{x)g(x)dx. 


— IT 
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T'Vi 

Vw 3 

'Pws 


Figura 8.4: Funcion / y sus proyecciones ortogonales en Wk, k = 1,3, 5 


Es decir nos estan pidiendo la proyeccion ortogonal de la funcion / en varios 
subespacios Wk, cada uno de ellos mayor que el anterior. 

Puesto que los vectores que generan cada subespacio Wk conforman una 
base ortogonal (se deja al lector la comprobacion), el calculo de la proyeccion 
es inmediato a partir de (n) la nota 8.5. Los coeficientes vendran dados por 

X _ (/>!) _ n x _ (/,sen(naQ) _ 2 ' # 

0 || 1|| 2 ’ n || sen(rcs )|| 2 ri 7 r ( ( ' ’’ 

(/, cos(na;)) 


/^n — 


cos nx) 


= 0, n = 1 ,..., k 


Es decir, la proyeccion en l-Fi, Wi coincide y es VwAfix)) = ^ sens; para W 3 
y IF 4 , la proyeccion es la misrna y resulta 

4 4 

VwAf( x )) = ~ sens + , sen(3s) 

7 r 37T 

mientras que en W 5 y We la proyeccion es 

4 4 4 

Vw 3 U( x )) = ~ sens + — sen(3s) + — sen(5s) 

7 r 37T 57 t 

En el espacio generado por la funciones trigonometricas {sen(ns), cos(ms)}, 
que son ortogonales respecto de este producto escalar, los coeficientes de la 
proyeccion son conocidos corno coeficientes de Fourier. 

En la figura 8.4, estan representadas la funcion y sus proyecciones. 
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METODO DE LOS MINIMOS CUADRADOS 


El metodo de los minimos cuadrados es una aplicacion de la propiedad des- 
crita en la Proposition 8.10 sobre la proyeccion ortogonal que permite resolver 
de forma aproximada sistemas de ecuaciones. 

Supongamos que tratamos de resolver un sistema de la forma Ax = b, donde 
A £ M m xn(I&), x C K n ybg K m . Identificando la matriz A con la matriz de 
una determinada aplicacion lineal que la define, en una base dada, podemos 
entender que el sistema tiene solution siempre y cuando b £ Im(ti). O dicho de 
otro modo, la columna correspondiente al segundo miembro debe ser linealmente 
dependiente de las columnas de la matriz A, que en esencia es lo que afirma el 
Teorema de Rouche-Frobenius. 

Supongamos que no existe solution para este sistema. En este caso, puede 
ser interesante estudiar para que vector o vectores x, Ax « b, esto es, tratamos 
de buscar una solution aproximada del sistema. 

Una forma de interpretar esta aproximacion es la siguiente: si Ax ss b, 
entonces podemos intentar encontrar x tal que ||Ax — b|| sea lo menor posible, 
esto es, tratamos de resolver el problema 

min ||Ax — b|[ 

X 

Observese que si el sistema si tiene solution, entonces el mfnimo del problema 
anterior es cero, y por tanto Ax = b; pero si no hay solution, tiene sentido 
buscar el vector x que haga menor esa norma, y por tanto que mas se parece a 
una solution. 

Por otra parte, dado cualquier vector x, es evidente que Ax £ Im(A), luego 
el problema anterior se puede escribir en los terminos 


min 

yGlm(A) 


l|y-b|| 


Si ahora miramos (8.5), el mmirno anterior se alcanza para 7 , im(A)(b). 

Mas aun, puesto que la proyeccion se puede calcular a traves de la matriz 
de proyeccion obtenida en (8.4), entonces el sistema se transforma en 

Ax = A(A T A)~ 1 A T b 


de aquf se deduce que 

x = (A t A)~ 1 A t b 

aunque en realidad no es necesario invertir, sino resolver el sistema 


A t Ax=A t b 
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Resolver de forma aproximada el sistema 

X\ + x 2 + X3 = 1 

x\ + x 2 — x 3 = 1 > 

X3 = l j 

Esta claro que el sistema dado es incompatible. Definiendo la aplicacion de 
matriz 



el sistema anterior se escribe como Ax = b con b = (1,1,1). Para resolverlo no 
tenemos mas que resolver el sistema 


A T Ax = A T b 

que en nuestro caso resulta 



que posee infinitas soluciones, de la forma (a, 1 — a, |). Cualquiera de ellas es 
una solucion aproximada. 6 


□ BH Ajuste de datos 

Un ejemplo tipico en el que se emplea el metodo de los mfnimos cuadrados 
es en el de los problemas de ajuste de datos. Una situation habitual en muchas 
aplicaciones sucede cuando disponemos de una serie de datos que han sido 
tornados y queremos encontrar una funcion que represente de la forma mas 

®En estos casos es frecuente seleccionar una de las soluciones atendiendo a algun criterio 
como por ejemplo la de menor norma. 
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precisa posible tal conjunto de datos. La eleccion del tipo de funcion a usar 
depende del fenomeno con el que estemos estudiando, y en la practica se suelen 
usar funciones sencillas, como pueden ser rectas o funciones cuadraticas. Veamos 
un ejemplo. 


Encontrar la recta que mejor aproxima a los puntos (1,1), (2,3), (3,5) y 
(4,6). 

En este caso buscamos una funcion lineal, de la forma y = a+bx que se ajuste 
de forma eficiente a los puntos dados. Si todos los puntos coincidieran sobre la 
misrna recta, esta claro que se deberfa poder resolver el siguiente sistema 


a + b = 1 

a + 2b = 3 
a + 36 = 5 
a + 4b = 6 


( 8 . 6 ) 


Puesto que dicha recta no existe, el sistema no tiene solucion y lo que hare- 
mos sera buscar una solucion aproximada usando el metodo de los minimos 
cuadrados. Procediendo como en el ejemplo 8.10, bastara resolver el sistema 
A T Ax = A T b donde 



En este caso resulta 

4a+ 106 = 15 1 
10a+ 306 = 46 j 

cuya solucion es a = — \ y 6 = 1^. 

La figura 8.5 muestra los puntos y la recta obtenida, tambien conocida como 
recta de regresion. 
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Figura 8.5: Ajuste de datos lineal 


mm _ 

CALCULO CON PYTHON 

La introduction de diversos productos escalares en este tema nos invita a 
seguir explorando nuevas capacidades de Python, que nos ayudaran a realizar 
este nuevo tipo de calculos. 

El producto escalar habitual en vectores de R n puede ser llevado a cabo 
desde NumPy con la funcion dot. Por ejemplo 


(1,2,3)-(-1,0,2) = 5 



corresponde a 

1 

>>> from numpy import array,dot 

2 

>>> a=array([1 , 2,3] ) 

3 

>>> b = array([-1 , 0,2]) 

4 

>>> dot(a,b) 

5 

5 


Por el contrario, SymPy no posee ninguna funcion esperifica para calcular el 
producto escalar, por lo que usarnos simplemente la expresion x ■ y = x T y, pero 
si posee un atributo para calcular la norma inducida por el producto escalar 
habitual: 


>>> from sympy import Matrix 
>>> a=Matrix([1,-2,-3,0]) 

>>> b=Matrix([-1,0,1,2]) 
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4 


5 

6 
7 


1 

2 

3 

4 


5 

6 


1 

2 

3 

4 


5 

6 


9 


10 


>>> a.T*b 
[-4] 

>>> a.norm () 

14 **( 1 / 2 ) 

es decir, (1, -2, -3,0) • (-1, 0,1,2) = -4 y ||(1, -2, -3,0)|| = Vli. 

Los productos escalares mas laboriosos que se han llevado a cabo son los 
que involucran el calculo de integrales. Tanto NumPy como SymPy permiten 
realizar calculo integral, aunque el primero lo hace mediante tecnicas numericas, 
mientras que el segundo permite hacer calculo simbolico, adaptandose mejor a 
nuestras necesidades. 


>>> 

from sympy import 

symbols,integrate 

>>> 

t = symbols ( ’ t ’ ) 


>>> 

p = l + t + t **2 


>>> 

q=2-3*t+t**2 


>>> 

integrate(p*q, (t , 

-1,1)) 

22/5 




esto es 

/ 4 22 

(1 + £ + £ 2 )(2 — 3£ + £ 2 ) dt = —— 

-l 5 

De este modo es posible calcular las normas y la ortogonalidad de las 
funciones del ejemplo 8.9: 

>>> from sympy import symbols,integrate,cos,sin,pi 
>>> x , n , m= symbols (’ x , n , m ’ ) 

>>> integrate(sin(n*x)*cos(m*x) ,(x,-pi,pi)) 

0 

>>> integrate(sin(n*x)*sin(m*x) ,(x,-pi,pi)) 

2*m**3*cos(pi*m)* sin(pi*n)/(2*m**2*n**2 - m**4 - n**4) + 2*n 
**3*cos(pi*n)* sin(pi*m)/(2*m**2*n**2 - m**4 - n**4) - 2*m 

*n**2*cos(pi*m)* sin(pi*n)/(2*m**2*n**2 - m**4 - n**4) - 

2*n*m**2*cos(pi*n)* sin(pi*m)/(2*m**2*n**2 - m**4 - n**4) 
>>> integrate(sin(n*x)**2,(x,-pi, pi )) 

(pi*n/2 - cos(pi*n)* sin(pi*n)/2)/n - (cos(pi*n)*sin(pi*n)/2 

- pi*n/2)/n 
>>> simplify(_) 

(pi*n - cos (pi*n)*sin(pi*n))/n 


Si leemos con calma el resultado se observa que: 

r 

/ sen (nx) cos(ma;) dx = 0 


sen(ro:r) sen (mx) dx = 


2 m 2 n 2 — m 4 — n 4 


m 3 cos(7rm) sen(7m)+ 


n 3 cos(7rn) sen(7rm) — mn 2 cos(7 rm) sen(7rn) — nm 2 cos(7rn) sen(7r m ) = 0 
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L 


— TV 


sen (nx ) 2 dx 


n 


1 


nn — cos(7rn) sin(7m) 


donde hemos de tener en cuenta que si n y m son niimeros naturales, entonces 
sen(n7r) = 0, \/n € N. 


La solucion aproximada de sistemas mediante el metodo de minimos cuadra- 


dos esta implementada en NumPy con una funcion que empleamos en el tema 4 
para obtener el rango de una matriz. Dicha funcion, linalg. lstsq, proporciona 
la solucion mediante minimos cuadrados de un sistema de la forma Ax = b, asi 
como information adicional sobre el sistema, como el rango de la matriz. Esta 
funcion tiene dos parametros de entrada, la matriz A y el segundo miembro b. 
Por ejemplo, si queremos resolver el sistema (8.6) del ejemplo 8.11, liaremos lo 
siguiente 

1 >>> from numpy import array,linalg 

2 >>> a=array([[l,l] , [1,2] , [1,3] , [1,4]]) 

3 >>> b=array([1,3,5,6]) 

4 >>> linalg.lstsq(a,b) 

5 (array([-0.5, 1.7]), array([ 0.3]), 2 , array([ 5.77937881, 

0.77380911])) 

Observamos que la respuesta de la funcion lstsq(ti,b) es amplia: el primer 
argumento es un arreglo con la solucion aproximada del sistema; el segundo 
argumento es el residue >, que es igual a ||tix — b||, con x la solucion aproximada, 
salvo que el rango de la matriz no sea maxirno, en cuyo caso es un arreglo vacio; 
el tercer argumento es, como ya vimos, el rango de la matriz A , mientras que el 
ultimo proporciona los valores singulares de la matriz A. 7 

Si resolvemos un sistema cuya matriz no tiene rango maxirno, y que por 
tanto conduce a infinitas soluciones, como en el ejemplo 8.10, 

1 >>> from numpy import array, linalg 

2 >>> a=array([[1,1,1] ,[1,1,-1] ,[0,0,1]]) 

3 >>> b=array([1,1,1]) 

4 >>> linalg.lstsq(a,b) 

5 (array([ 0.5 , 0.5 , 0.33333333]) , array([] , 

dtype=float64), 2, array([ 2.00000000e+00, 1.73205081e 

+00, 7.23911034e-17])) 

vemos que la solucion obtenida es la de menor norma. 


□ II - 

APLICACION: LIGHTS OUT!, SEGUNDA PARTE 


En la section 4.7 presentamos el juego Lights Out! y lo planteamos como un 
problema algebraico equivalente a resolver un sistema de ecuaciones. En concre¬ 
te, vimos que una determinada configuration de luces encendidas y apagadas 


7 Los valores singulares de una matriz son las rai'ces de los autovalores de la matriz A T A. 
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representada por un vector b £ Z| 5 es alcanzable si resulta ser una combination 
lineal de las columnas de la matriz A definida en (4.13). 

Ahora vamos a usar lo aprendido sobre aplicaciones lineales y ortogonali- 
dad para identificar de forma sencilla cuando un vector b corresponde a una 
configuration alcanzable. Para ello hemos de prestar atencion a un resultado, 
cuya demostracion esta propuesta en el ejercicio 31, y que afirma que si A es la 
matriz de un endomorfismo, entonces 

ker(A) = lm(A T ) ± y Im(A) = ker (A T ) ± 

En nuestro caso particular, la matriz A de (4.13) es simetrica, por lo que el 
resultado anterior se traduce en 

ker(A) J_ = Im(A) 

Dicho de otro modo, un vector que pertenezca a Im(A) debe ser, necesariamente, 
ortogonal a ker(A). 

En resumen, si un vector b £ Z| 5 es alcanzable, entonces debe pertenecer 
al subespacio generado por las columnas de A, es decir, debe pertenecer al 
subespacio Im(A), y segun acabamos de ver, debe ser ortogonal a cualquier 
vector de ker(A). Tenemos por tanto un sencillo test para comprobar si b es 
alcanzable. 

Vamos pues a determinar el espacio ker(A): para ello hemos de resolver el 
sistema 

*i + x 2 + x 6 = 0 

Xi + X 2 + X 3 + X 7 = 0 

x 2 + x 3 + X 4 + x s = 0 


X\9 + X 23 + X 2 4 + X 25 = 0 

X 2 0 + X 2 4 + x 2 5 = 0 

obteniendose que una base de soluciones del mismo viene dada por los vectores 

m = (o,i, 1,1, o,i, o,i, o,i, 1,1, o,i, 1,1, o,i, o,i, o,i, 1,1,0) 
n 2 = ( 1 , 0 , 1 , 0 , 1 , 1 , 0 , 1 , 0 , 1 , 0 , 0 , 0 , 0 , 0 , 1 , 0 , 1 , 0 , 1 , 1 , 0 , 1 , 0 , 1 ) 

Por ejemplo, supongamos que la configuration initial es la que aparece en la 
figura 8.6. Es decir, 

b= (1,1,1,0,1,0,1,0,1,1,0,1,0,0,1,1,0,1,0,1,1,0,1,1,1) 

Ver si es posible apagar todas las luces de la figura 8.6 equivale a comprobar 
si 


b ■ ni = b • ri2 = 0 
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Figura 8.6: iSe pueden apagar todas las luces? 


Haciendo el producto escalar habitual, modulo 2, se verifica que, en efecto, 
b € ker^A) 3 -. 

Con un poco de paciencia se puede usar el metodo de Gauss para el sistema 
Ax = b, realizando todas las operaciones modulo 2, para obtener una solucion: 


= ( 0 , 1 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 1 , 0 , 0 , 0 , 0 , 0 , 0 , 1 , 0 , 0 , 0 , 0 , 1 , 0 , 0 , 1 ) 


Pero ademas, puesto que Ani = 0 y An 2 = 0, se tendra que 


x, x + ni, x + n 2 , x + ni+n 2 


tambien son soluciones. 


mm - 

EJERCICIOS 
Ejercicios de repaso 

B1 Sea (x, y) = xxyi + (xi + x 2 )(yi + y 2 ) + (aq + x 2 + x 3 )(yi + y 2 + 2 / 3 ) un 
producto escalar en R 3 . Encontrar la matriz del producto escalar respecto de la 
base canonica de R 3 . 

1 Ortogonalizar la base de R 3 dada por los vectores xi = (1,0,0), x 2 = 
(4, —2,0) y x 3 = (1,1, 5). 

1*1 Encontrar una base ortogonal del subespacio vectorial 
M = {x M 3 : X\ A 2x 2 d - dx 3 = 0} 

121 Decidir si los siguientes pares de subespacios son ortogonales: 

(a) Li = L(( 2,1, -1), (0,1,1)), L 2 = L((-1,2,0)) 

(b) Lx = L((- 3,0, 1 ), L 2 = {(xi, x 2 , x 3 ) e R 3 : 3xi - x 3 = 0} 

(c) Lx = {(xi, x 2 , x 3 ) £ R 3 : xi + x 2 - x 3 = 0, xx - x 2 = 0}, 

L 2 = {(xi,x 2 ,x 3 ) € R 3 : xi + x 2 = 0} 
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1*1 Se considera el espacio de polinomios Pj|[— 1,1] con el producto escalar 
(p(x) ,q(x)) = J p(x)q(x) dx 

y sea W el subespacio generado por los polinomios x — 1 y x 2 . Determinar una 
base ortogonal de W- 1 . 

latil Sean los vectores de R 5 , a = (1,2,0, — 1, 0), b = (0,1,—1,1,0) y c = 
(0,0,1, 2,1). Descomponer c en dos vectores, uno de cllos combination lineal de 
a y b y el otro ortogonal a este. 

|3| iQue combination lineal de los vectores (1,2,—1) y (1,0,1) es la mas 
cercana a (2,1,1)? 

|3I En el espacio vectorial 

V = {/ : [0,1] —» R : / es derivable, /(0) = 0}, 
se considera el producto escalar 

(f,9)= [ f'{x)g'{x)dx 
Jo 

(a) Ortogonaliza las funciones fi(x) = x , fi{x) = x 2 . 

(b) Halla la proyeccion ortogonal de /(: x) = e~ x — 1 sobre el subespacio 
generado por /i y / 2 . 


|3] Para los siguientes apartados, hallar la solution del sistema Ax = b por 
mmimos cuadrados: 


(a) A = 





(b )A = 





Problemas 

I3HH Sean U! = (—2,—1,1), u 2 = (0, —1,0) y u 3 = (1,—1,0) vectores l.i. 
de R 3 . Definimos un producto escalar en R 3 afirmando que {ui, u 2 , u 3 } es una 
base ortonormal. Encontrar la expresion analftica de este producto escalar en la 
base canonica de R 3 . 
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HIM Ortogonalizar los vectores de R 4 : xi = (1,1, 0,0), x 2 = (1,2, 0,0) y 
x 3 = (0,0, —1,1), y hallar una base ortogonal de R 4 que los contenga. 

|3£J Encontrar una base ortonormal para los siguientes subespacios vecto- 
riales: 

(a) El subespacio de Pj|[— 1,1] 

M = {p{x) G P|[-l, 1] : xp'(x) = p(x)} 
con el producto escalar del ejercicio 5. 

(b) El subespacio de A1 2 (R) 

JV={AeM 2 (R) : tr(.A) = 0} 

con el producto escalar definido en el ejercicio 23. 

lag Encontrar el complemento ortogonal de los subespacios vectoriales M y 
N del ejercicio 12. 

|3U En A4 2 (R) con el producto escalar del ejercicio 23, hallar el complemento 
ortogonal del subespacio de las matrices diagonales de A4 2 (R) y el complemento 
ortogonal de las matrices simetricas de A4 2 (R). 

QQ Determinar la proyeccion ortogonal y la minima distancia de una matriz 
X G A4 2 (R) al subespacio de las matrices diagonales, esto es, se trata de calcular 
min \\D — X||, donde V es el conjunto de las matrices diagonales de A4 2 (R). 

HUa Considera P\ la matriz de la aplicacion que a cada vector le asocia su 
proyeccion sobre el espacio generado por el vector ai, donde ai = ( — 1,2,2). 
Haz lo mismo con P 2 , donde a 2 = (2, 2, —1). Multiplica las matrices resultantes 
P\ P ‘2 y explica por que sale ese resultado. 

OH Sea C([—7r,7r]) el espacio euclideo de las funciones continuas en el 
intervalo [—7r, 7r], con el producto escalar 



Sea L el subespacio vectorial de V generado por los vectores 1, sent y cost. Se 
pide 

(a) Encontrar la proyeccion ortogonal del vector h(t) = (t — tt) sobre L. 

(b) Hallar el vector p(t) G L que haga minirno el valor de la integral 
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* iati:i Hallar el polinomio Q(t) = t 3 + at 2 + bt + c para el cual la integral 



sea lo mas pequena posible. 

|3£| En un concesionario de automoviles se han realizado una serie de 
observaciones tratando de relacionar el precio y, s de los vehiculos con su peso 
Xi. Dados los datos de la tabla adjunta hallar por el metodo de los minimos 
cuadrados el mejor ajuste lineal y = ax + b. 


peso (en Tm) 0.8 1 1.2 1.3 

precio (en millones) 12 3 5 


|gg{| Una editorial analiza las ventas realizadas de los libros de uno de sus 
mejores autores durante los ultimos cuatro ahos, reflejadas en la tabla 


12 3 4 


ano 


venta (en millones) 1 1.5 3 5 


(a) Hallar el ajuste lineal por el metodo de los mmimos cuadrados. 

(b) ^Cuantos libros de dicho autor espera vender la editorial en el quinto ano? 

law Se consideran los puntos (1,1), (2,4), (3, 7), (4, 9). Ajustar diclros puntos 

(a) Por una funcion polinomica de segundo grado y = a + bx + cx 2 utilizando 
el metodo de los mmimos cuadrados. 

(b) Por una funcion y = a + bx + cx 2 + dx 3 . 

□ □H Ejercicios teoricos 

13^9 Decir cuales de las siguientes funciones (•,•): K 2 x M 2 —>• K definen un 
producto escalar en R 2 : 

(a) (x, y) = aqj/i + 2x 2 y 2 + 2.x 2 yi - 3x ± y 2 

(b) (x, y) = x±yi — x 2 y 2 

(c) (x, y) = x\y 2 + 2xi y 2 + 2>yix 2 + 7x 2 yi 

(d) (x, y) = 2xi i/ 2 + 3x22/2 + 2xiy 2 + 2x 2 yi 
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lawci En el espacio vectorial de las matrices Ad 2 (R), demostrar que el producto 

(A,B) = tr {AB t ) 


es un producto escalar. 

|2£| Sea V un espacio euclideo. Demostrar: 

(a) 2(||u|| 2 + ||v|| 2 ) = ||u + v|| 2 + ||u — v|| 2 

(b) 4(u, v) = ||u + v|| 2 — || u — v|| 2 

(c) 2(u, v) = || u + v|| 2 — || u|| 2 — || v|| 2 

HW<1 Demostrar que la desigualdad de Schwarz es una igualdad si y solo si 
los vectores son proportionates. 

I3BBI Si x e y son dos vectores cualesquiera de un e.e. E, demostrar que 

||x — y|| > ||x|| — ||y|| 

|2U Sea E un e.e., demostrar que u + v y u v son ortogonales si y solo si 

HI = IMI- 

|2£] Demostrar la siguiente generalization del teorema de Pitagoras: 

|| Xl + X 2 + ... + x„|| 2 = || Xl || 2 + ||x 2 || 2 + • • • + ||x„|| 2 
si los vectores xi, ...,x„ son ortogonales entre si. 

* iaKil Sea V un e.e. y {m, u 2 ,..., u n } un conjunto de vectores ortogonales. 
Demostrar que: 

(a) ^ < || v|| 2 , Vv £ V (desigualdad de Bessel). 

i =1 Hill 

(b) Si los u, forman una base ortogonal de V entonces 

(v,w) = ^2 ’ ^ v,w e V (identiclad de Parserval) 


HKiil Demostrar que si (x,x) = con (xi,...,x n ) las coordenadas de x 

i—1 

en una base £>, entonces esta base es ortonormal. 

* !*>■ Sea A la matriz de un endomorfismo de K". Demostrar que 

ker(ti) = Im {A T ) ± y Im(ti) = ker (A T ) ± 






8.6 ■ Ejercicios 
Ejercicios adicionales 

B3 Usar Python para comprobar que el conjunto de funciones de C([0, 27 t]): 

r 1 1 i i „ i i i i 

i , , —= sen t, —= cos t, sen 2 1, —^ cos 2 1,.... —— sen nt , —= cos nt, > 

1\/27tV7t a/tt Vtt Vtt Vtt J 

es un conjunto ortonormal con el producto escalar 



(/, 5 > 


o 


B3 Considerese el juego descrito en el ejercicio 31 del tema 4. Encontrar el 
espacio ker(A), donde A es la matriz del sistema que define el juego y razonar 
si toda configuration puede ser alcanzable para el mismo. 





9 Espacio afin 


r 




En los temas anteriores hemos interpretado en mas de una ocasion diversos 
elementos que aparecen en los espacios vectoriales como conjuntos geometricos 
tales como rectas o pianos. Sin embargo, desde un punto de riguroso, esta 
interpretation no es exacta pues los objetos geometricos estan formados por 
puntos y estos son objetos fijos, mientras que el concepto de vector es una 
magnitud que no esta sujeta a una position espacial determinada. En definitiva, 
los espacios vectoriales no son los conjuntos apropiados para describir los objetos 
geometricos que el lector habra estudiado en cursos anteriores. 

En este tema vamos a introducir el espacio afi'n como el marco geometrico 
adecuado en el que poder trabajar con los objetos tipicamente estudiados en 
geometn'a plana o espacial, y en el que poder plantear problemas metricos y 
transformaciones lineales. 

Hi - 

ESPACIO AFIN Y ESPACIO METRICO 


La definition de espacio afi’n 1 recupera el concepto intuitivo de vector como 
el objeto que marca la direction entre dos puntos del espacio, asociandolo a un 
elemento de un espacio vectorial. 



Sea V un espacio vectorial y A un conjunto no vacio cuyos elementos 
denominaremos puntos. Se dice que A es un espacio afin asociado a V si existe 
una aplicacion 

ip : Ax A —> V 

(P,Q) —► <p(P,Q) = p$ 

que posee las siguientes propiedades: 

(i) Para todo punto M £ Ay todo vector x £ V existe un unico punto N G A 
tal que MI\t = x. 


X E1 termino fue introducido por Euler en 1748 su libro Introductio in analysin infinitorum. 
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Un vector x = PQ diremos que tiene origen en P y extremo en Q. Tambien 
se define la dimension de un espacio afi’n como la dimension del espacio vectorial 
asociado. En todo lo que sigue trataremos solo con espacios afines de dimension 
finita. 

En definitiva, un espacio afin es una coleccion de puntos de manera que para 
cada par ordenado de ellos, P y Q, podemos construir el vector con origen P y 
extremo Q , esto es p£}. Se verifican las siguientes propiedades: 



Dados los puntos M, N, P y Q, se tiene: 
(i) Si Wft = P$ entonces 
(n) Ml\f = 0 si y solo si M = N. 

(m) = 


Demostracion: 


(i) Sumando a ambos miembros de la igualdad Wfi, 

wft + N~fi = N~P + P$ 

y usando la propiedad (il) de la definicion, Alp = N$. 
(n) Nuevamente por la propiedad (n) de la definicion, 


~m$ + Wi$ = Wisi => Isrft = o 

Recfprocamente, si MN = wfi = 0, por la propiedad (i) de la definicion 
M = N. 

(in) Es evidente que MN + NM = MM = 0, luego MN = — NM. 
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ODD Sistema de referencia y coordenadas 


Si en el espacio afi'n n-dimensional A se considera un punto fijo O £ A, que 
se denomina origen de coordenadas , y una base B del espacio vectorial asociado, 
el conjunto TZ = {0;B} es un sistema de referencia que nos permite obtener 
las coordenadas de un punto cualquiera P £ A, a traves de las coordenadas 
del vector ()l >: ’ respecto de la base B. Se notara P(pi, ■ . ■ ,p n )n, 0 simplemente 
P(pi,... ,p n ) cuando no haya posibilidad de confusion. 2 

Si tenemos dos puntos P(pi, ■ ■ . ,p n )n y Q(q i, • ■ ■, q n )n^ entonces el vector 
P() satisface 

= p6 + o^ = o^-aP 


y dado que las coordenadas de ~Op y OQ coinciden con las de P y Q respecti- 
vamente, entonces 


= (<7l ~Pl,---,q n -Pn) 


B 


que coincide con la expresion que el lector habra visto en cursos previos de 
geometria. 

Cuando el punto 0(0, ...,0) y B es la base canonica, lo denominaremos 
sistema de referencia cartesiano. 


UBB Cambio de sistema de referencia 

A1 igual que ocurre con las bases, dados dos sistemas de referencia TZ = 
{0;B} y TZ' = {0'\B'} en un espacio afi'n A, buscamos la relation existente 
entre las coordenadas en cada uno de los sistemas de referencia de un mismo 
punto P £ A. 

Supongamos que P tiene coordenadas P{x i,... ,x n )n = (x[,.. . x' n )-jz> y 
pongamos que 0'(ci,..., c n )Tz- Dado que para cada punto P se verifica que 


of> = oo’ + cyp 


entonces, si Mg, = (a tJ ) es la matriz de cambio de base de B’ a B , se tiene que 



que son las ecuaciones del cambio de sistema de referencia. Estas ecua- 


2 Notese la omision del signo de igualdad en la notacion de los puntos, no asi en la de los 
vec tores. 
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ciones se pueden abreviar del siguiente modo: 



Estas ecuaciones permiten calendar el cambio de sistema de referenda inverso 
usando para ello la inversa de esta matriz, tal y como sucede con los cambios 
de base en espacios vectoriales. 

□ QU Espacio affn euclideo 

Si el espacio vectorial asociado a un espacio affn A es ademas un espacio 
euclideo, es decir, dotado de un producto escalar, se dira que A es un espacio 
afin euclideo. Se dira que un sistema de referenda en un espacio affn 7 Z = {O; B} 
es ortonormal si la base B es ortonormal. 



Dado un conjunto cualquiera A, una aplicacion: 

d: Ax A —> R+ U {0} 
( x,y ) —>• d(x,y ) 


que verifique: 

(i) d{x , y) = 0^x = y,Wx,y£A 
(il) d(x, y) = d(y, x), Vx, y S A. 

(ill) d(x, y) < d(x, z ) + d{z, y ), Vx, y,z£ A. 

se dice que es una distancia. En tal caso decimos que A es un espacio metrico. 


En un espacio affn euclideo A podemos definir una distancia d(P, Q ) = 
||P£^||, de modo que A es un espacio metrico. 


— ^ - 

El piano R 2 , entendido como un conjunto de puntos, tiene estructura de 
espacio afin, si lo consideramos conjuntamente con el espacio vectorial R 2 . Si 
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tomamos el sistema de referenda formado por el punto 0(0, 0) y la base canonica 
de R 2 , {(1, 0), (0,1)} tenemos el sistema de referenda canonico en el que las 
coordenadas de cada punto P(x,y) coinciden con las coordenadas del vector 
que une el origen O con el propio punto P. 

Si en este espacio consideramos el producto escalar habitual, la metrica a 
la que hace referenda la definicion anterior corresponde a la distancia euclidea 
que el lector ya conoce. Esto es, la distancia entre dos puntos P(x, y) y Q(x' : y') 
viene dada por 

d(P,Q) = \\P$\\ = vV - X ) 2 + (y> - yY 


□ 1 - 

VARIEDADES AFINES 



Dado un espacio afin A asociado a un espacio vectorial V, se dice que un 
subconjunto L C A es una variedad afin de A si existe un punto P € L tal que 
el conjunto 

W = {P$ :QGL} 
es un subespacio vectorial de V. 


En definitiva, una variedad afin es a un espacio afin, lo que un subespacio 
vectorial es a un espacio vectorial. Las variedades afines tambien se puede definir 
del siguiente modo: dado P £ A y W un subespacio vectorial, una variedad afin 
L es un subconjunto de A de la forma 

L = {Q G A : P$ G W} 


De este modo, podemos escribir una variedad afin como L = P + W = {P + w: 
w G W}. A1 subespacio W se le denomina direction de la variedad. 



La variedad afin es independiente del punto usado en su definicion. Es decir, 
si L = P + W y P' £ L, entonces L = P' + W. 
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Demostracion: 

Observemos en primer lugar que si P' £ L entonces PP’ = w € W. Sea ahora 
Q G P + W, entonces Q = P + x para cierto x S W. Asf, 

Fq = PbP + P$ = -w + x&W 

luego Q G P' + W; es decir, P + W C P' + W. La inclusion contraria se prueba 
de identica forma. 



Sea A € A / J mX n(K) y b £ K m y consideremos el sistema de ecuaciones 
lineal Ax = b. Si el conjunto de soluciones de este sistema es no vacfo y P es 
una solucion del mismo, entonces dicho conjunto define una variedad lineal en 
el espacio afm que pasa por P y tiene como direction el subespacio vectorial 
formado por las soluciones del sistema homogeneo asociado, Ax = 0. 

Recfprocamente, toda variedad affn puede definirse como el conjunto de 
soluciones de un sistema lineal de ecuaciones Ax = b. 


La demostracion es consecuencia inmediata de la Proposition 3.2 que trata de 
la estructura de las soluciones de un sistema no homogeneo, y de los Teoremas 4.7 
y 4.8. 



Veamos algunas construcciones con las que el lector estara familiarizado: 

(i) En el espacio affn R 2 , consideramos el punto P( 1,2) y el subespacio 
W = L((l,l)). La variedad affn L = P + W corresponde a la recta que 
pasa por P y tiene la direction W. Los puntos de esta recta tendran por 
expresion 


0,2/) = (1,2) +*(1,1), t G R => \ X 

[y = 2 + t 

que corresponden a la ecuacion vectorial y ecuacidn parametrica de la 
recta, respectivamente. Si despejamos el parametro t de las ecuaciones 
parametricas se obtiene 

x — l = y — 2=>x — y = — 1 

que es la ecuacidn general o cartesiana de la recta. 
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Es posible obtener directamente la ecuacion general de la recta si obte- 
nemos primero un sistema de ecuaciones homogeneo para la direction de 
esta, en este caso, la ecuacion x — y = 0. Por tanto, segun la Proposi¬ 
tion 9.3, la ecuacion sera un sistema no homogeneo con la misrna matriz, 
es decir de la forma x — y = a. Para determinar el parametro a basta 
imponer que el punto P(l, 2) verifique dicha ecuacion. luego a = — 1. 

(n) En M 3 consideramos un punto P(3, —1,1) y el subespacio W generado 
por el vector v = (2, 0,1). Para obtener las ecuaciones de la recta corres- 
pondiente a la variedad afin L = P + W procedemos como en el ejemplo 
anterior, obteniendo un sistema de ecuaciones homogeneo del espacio W: 

(2 0 l\ (x 2 =0 

\£i x 2 x 3 J [2a; 3 — X\ = 0 


de manera que las ecuaciones de la recta seran 


x 2 = a 
2x 3 — xi=P 


=> a = —1, /3 = —1 


donde a y j3 se obtienen al imponer que el punto P satisfaga ambas 
ecuaciones. 


(ill) La variedad afin correspondiente al piano que pasa por el punto P(—1,2,0) 
y tiene como vector normal el vector (1,1, —1) se obtiene considerando el 
subespacio vectorial ortogonal a dicho vector, que tiene como ecuacion 
Xi + X 2 — x 3 = 0; de modo que la ecuacion del piano sera 


Xi + X 2 — x 3 = a => a = 1 

donde a es obtenida como en los ejemplos anteriores. 

(iv) Para calcular la ecuacion del piano que pasa por tres puntos dados, 
M(l, 1,0), N(— 1,2,1) y P(0, —1,2), nos basta considerar cualquiera de 
los tres puntos, junto con el subespacio generado por dos vectores inde- 
pendientes del piano, que se obtiene mediante pares de puntos, es decir, 

M(1,1,0); =(-2,1,1); Mi* = (-1,-2,2) 

En lugar de proceder como en los ejemplos anteriores calculando la ecua¬ 
cion homogenea correspondiente al subespacio vectorial y luego obteniendo 
el termino independiente, podemos tambien razonar del siguiente modo: 
cualquier punto del piano buscado Q(x,y,z), satisfara que el vector MC$ 
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debe ser linealmente dependiente de los otros vectores MI& y M$, de 
modo que 


f x — 1 

y - 1 A 

x — 1 

y- 1 2 

rango I —2 

1 1 = 2 => 

—2 

1 1 

V-' 

-2 2) 

— 1 

-2 2 


= 0 


Resolviendo el determinante se obtiene la ecuacion 4x + 3y + 5z = 7. 


□ BO Posicion relativa de variedades afines 



Dadas dos variedades afines L\ y L 2 , diremos que estas se cortan si LiHL 2 
0. Si las variedades no se cortan diremos que son paralelas si W\ C W 2 (6 
W 2 C W\), donde W, es la direction de la variedad L,. En caso contrario 
diremos que las variedades se cruzan. Del mismo modo, dos variedades son 
perpendiculares si W\ C W^~ (6 W 2 C W j 1 ). 


Para estudiar la posicion relativa de variedades lineales hemos de estudiar 
su intersection, resolviendo los sistemas lineales de ecuaciones que las definen. 
Veamos algunos ejemplos. 



(i) Dada la recta r = P+ (v), con P(—2, 0, —1) y v = (3,1,1) y el piano 7r de 
ecuacion x± — X 3 = 2, para averiguar su posicion relativa consideraremos 
el sistema formado por las ecuaciones de ambas variedades. 

Puesto que las ecuaciones de r son x\ — 3x 2 = 1, x 2 — X 3 = 1, debemos 
resolver el sistema 

) xi — 3x 2 = 1 

x 2 3x 3 = 1 => xi = l, x 2 = j, x 3 = 

x\ - x 3 = 2 

es decir, la recta y el piano se cortan en el punto (|, j, — 
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(n) Estudiamos ahora la position relativa de los pianos 


7Tl = X\ — X 2 + 3*3 = —1, 7T 2 = x 2 — *3 = 5 


Estudiando el sistema formado por ambas ecuaciones resulta un sistema 
compatible indeterminado, de modo que existen infinitas soluciones, lo 
cual expresa que ambos pianos se cortan en una recta. Para averiguar un 
punto y un vector que generan dicha recta nos basta resolver el sistema 
en forma parametrica, esto es 

h ~ X ' 2 + 3X3 = =► (4 - 2t, 5 + t, t) = (4, 5, 0) + t(- 2,1,1) 

[*2 -*3 = 5 

es decir, es la recta generada por el punto (4, 5, 0) y el vector (—2,1,1). 

Tambien es posible obtener la ecuacion de la recta resolviendo el sistema 
homogeneo asociado, con lo que obtendrfamos un vector de la misma, 
obteniendose luego una solution particular para el sistema. 

(ill) Position relativa de las rectas 



Si tratamos de resolver el sistema formado por las cuatro ecuaciones que 
definen ambas rectas observamos que este es incompatible, de rnanera 
que las rectas son paralelas o se cruzan. Vearnos entonces como son 
sus direcciones: para ello resolvemos los sistemas homogeneos asociados 
obteniendo: 


W ri =L( 1,1,-1), W r2 =L(( 0,1,1)) 


Puesto que W ri ^ W r2 las rectas no son paralelas y por tanto se cruzan. 
De hecho podemos observar que las rectas son perpendiculares pues W ri _L 
W r2 . 


01 


PROBLEMAS METRICOS 


El concepto de proyeccion ortogonal en un espacio euclideo puede ser exten- 
dido a los espacios afines a traves del siguiente resultado. 
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Sea L = A+W una variedad afin de un espacio afin euclfdeo A tal que L ^ A 
y sea B € A tal que B ^ L. Entonces existe una variedad unidimensional (una 
recta) r = B + V tal que r es perpendicular aLyrflL^0. 


Demostracion: 

Consideremos el vector A l'l y su proyeccion o rtogp nal sobre el espacio W, esto 
es Vw{A&). Sea B' = A + Vw(AB), es decir AB' = Vw(AI^). Esta claro que 

A^ = AB' + Wb 


y de la definition de proyeccion ortogonal (Definition 8.8) se tiene que 

A h — Vw{A$) + Q w (A^) 

Dado que esta descomposicion es unica se tiene que Qw(A$) = B’B. 

Consideramos ahora el subespacio V generado por el vector BB' y la varie¬ 
dad (la recta) r = B + V. Esta claro que V C W- 1 , es decir r es perpendicular 
a L y B' £ r D L. 


El punto B' obtenido en la construction anterior se denomina proyeccion 
ortogonal del punto B sobre L y se notara por Vl(B). Es importante resaltar 
que B' tambien se obtiene corno la intersection entre L y = B + W 1 -. 



Proyectar el punto ti(l,0, 2) sobre la recta L = P + (w), con P(l,l,l) y 

w = (-1,2,1). 

Tal y como hemos comentado, para construir Vl{A) construimos en primer 
lugar la variedad L\ = A + (donde W = (w)), es decir la variedad afin que 
pasa por A y tiene como direction el espacio ortogonal al generado por el vector 
w. Como hemos visto en el tema anterior, un sistema de ecuaciones implicitas 
para W 1 - viene dado por —x\ + 2x2 +£3 = 0, de modo que la variedad L\ tiene 
por ecuaciones 

—x\ + 2x 2 + x 3 = 1 
Intersecamos ahora con la recta L de ecuaciones 

x\ + x 3 = 2, x\ + 2a; 2 = 3 

que da lugar a un sistema cuya solution es la proyeccion buscada (|, |, |). 
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Como vimos en la section 9.1, la distancia entre dos puntos en el espacio 
affn se obtiene a traves de la norma del vector que une los puntos. Gracias 
a la proyeccion ortogonal podemos obtener la distancia entre un punto y una 
variedad afm; dado un punto P y una variedad L, la distancia de P a L, defmida 
por 

d(P, L ) = min ||P^| 


la obtenemos a traves del siguiente resultado. 



Dado P un punto y L una variedad afm de un espacio A, se tiene que 
d(P,L) = d(P,V L (P)) 


Demostracion: 

Sea L = A + W, con A £ A y W la direction de L. Sabemos que P' = Vl{P) 
corresponde al punto tal que AP' = Vw(aP). Sea ahora Q £ L cualquiera, 
entonces 

aP = a$ + qP 


y como AU! £ W, de la Proposition 8.10 sabemos que 

ll^ll <110^11, VQeL 


lo que prueba que la menor distancia entre P y cualquier punto de L se obtiene 
a traves de la proyeccion ortogonal. 



En R 3 consideremos un punto P(xo,yo, zq) y un piano de ecuacion ax + 
by + cz + d = 0. Para calcular la distancia del punto al piano construimos la 
variedad ortogonal al piano que pasa por P, esto es, P + w con w = (a,b,c). 
Usando la ecuacion vectorial de esta recta, para intersecarla con el piano se ha 
de encontrar t £ R tal que 

. , , . ,. , . axn + byn + CZn + d 

a(x 0 + at) + b(y 0 + tb ) + c(z 0 +tc)+d = 0^>t = - „ „ —5- 

a z + b z + c z 

Para este valor de t se obtiene el punto P' correspondiente a la proyeccion del 
P sobre el piano. Por tanto, la distancia sera la norma de este vector: 
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\PP'\\ = \\(ta,tb,tc) || = \Jt 2 [a 2 + b 2 + c 2 ) 
ax 0 + by 0 + cz 0 + d 


/ 2 , ,2 , —2 l aa: o + &Z/o + c^o + d\ 

V a z + b- + c z = - . - - 

\J a 2 + b 2 + c 2 


a 2 + b 2 + c 2 

con lo que se obtiene la conocida formula de la distancia de un punto a un piano. 


Tambien podemos definir la distancia entre dos variedades P| y P 2 como la 
menor distancia existente entre cualesquiera puntos de las variedades, es decir, 

d(L 1 ,L 2 ) = min d(P,Q) 

P£L i 
QGL2 


Dadas dos variedades L\= A\ + W\ y L 2 = A 2 + W-j se tiene que 

d(L i, L 2 ) = d(A±, L) 

donde L = A 2 + (W\ + W 2 ), es decir, la variedad que contiene a L 2 y es paralela 
a L\. 


Demostracion: 

Consideremos dos puntos Pi y P 2 de L i y L 2 , respectivamente. Sea ahora 
wi = P\A\ G W\ y sea P = P 2 + wq. Notese que Pei. 

Se tiene que 

PiP 2 = P±Ai + AiP + PP 2 = Wj + Alt’ — W! = A 1 fi 

de modo que d(Pi,P 2 ) = d(A 1 ,P). Puesto que P G P, deducimos que 
d(Pi,P 2 ) > d{A\,L). Como esto es cierto cualesquiera que sean los puntos 
Pi y P2 en Pi y P 2 , respectivamente, en particular es cierto para los puntos en 
los que se alcanza la distancia minima, es decir, 

d(Li,L 2 ) > d(Ai,L) 

Por otro lado, consideremos ahora Q = Vl{A\). Puesto que Q G P, podemos 
escribir Q = A 2 + v 1 + v 2 , para ciertos vectores v x G W\ y v 2 G W 2 . Si ahora 
llamamos Pi = Ai — v x y P 2 = A 2 + v 2 , que obviamente verifican que Pi G Pi 
y P2 G P2, tambien se tiene que 

AiC} = A1 Pi + P\P 2 + P 2 t^ = —vi + P\P 2 + Vi = P\P 2 
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Como Q es el punto que da la distancia minima de A\ a L , tenemos que 
d(Ai,L) = ||PiP 2 ||- Dado que Pi y P 2 estan en Li y L 2 , respectivamente esta 
claro que 

d(Ai,L) > d(Li,L 2 ) 


De la doble desigualdad se obtiene el resultado. 



Calcular la distancia entre las rectas r y s dadas por 


r= (1,0,— 1) + <(0,1,1)}, s={ X V + Z 

[x + y = 2 

Segun la proposicion anterior, la distancia d(r, s ) viene dada por la distancia de 
un punto de r, a la variedad L que contiene a s y es paralela a r. Por tanto, 
construyamos en primer lugar dicha variedad L. 

Calculamos la direccion de s encontrando una base del subespacio vectorial 
asociado, esto es 


x — y + z = 0 
x + y = 0 


=>■ Direccion de s = (—1,1,2) 


Consideremos un punto cualquiera de s, por ejemplo (1,1,1), y construyamos 
la variedad L, en este caso el piano, que pasa por (1,1,1) y tiene direccion 
((0,1,1), (—1,1, 2)). Como virnos en (iv) del ejemplo 9.2, la ecuacion del piano 
vendra dada resolviendo 


x — 1 y — 1 z — 1 

0 1 1 

-1 1 2 


= 0=>ir — y + z = 1 


Luego d(r,s) = d((l, 0, — 1), L), que segun hemos visto en el ejemplo 9.5 viene 
dada por 

l-ll 

■s/3 


d ((1,0, —1),L) 
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Obtener la perpendicular comun a las rectas 


__ ( 2x + y = 1 
\x + z = —\ 


s = 


x — 2y — z = 1 
x — y = 0 


En primer lugar consideremos W, la direccion perpendicular a r y s simultanea- 
mente: para ello, obtenemos primero las direcciones de r y s: 


2x + y = 0 


( 1 ,- 2 ,- 1 ) 


x — 2y — z = 0 
x — y = 0 


( 1 , 1 ,- 1 ) 


[x + z = 0 

y la direccion perpendicular a r y s vendra dada por las soluciones del subespacio 


x — 2y — z = 0 
x + y — z = 0 


W= <( 1 , 0 , 1 )) 


Ahora, la perpendicular comun se obtiene mediante la intersection de la variedad 
7Ti que contiene a r y es paralela a W con la variedad 7T2 que contiene a s y es 
paralela a W : 


7Tl = 


7T 2 = 


x y — 1 z + 1 
1 -2 -1 

1 0 1 


= 0=>cc + y — z = 2 


x y z + 1 

1 1 -1 

1 0 1 


= 0 => x — 2y — z = 1 


(notese que el punto (0,1, —1) Gr y (0,0, —1) £ s). Entonces, la perpendicular 
comun es la recta 

\x + y — z = 2 
\ x — 2y — z = 1 


mm - 

APLICACIONES AFINES 


Las aplicaciones alines son similares a las aplicaciones lineales pero definidas 
en espacios afines. Dado que una aplicacion afm transforma unos puntos en 
otros, podemos considerar una aplicacion asociada que transforma los vectores 
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que conectan esos puntos en otros vectores. En esencia, una aplicacion afm sera 
aquella que hace que la aplicacion asociada sea lineal. 


Sean A y A! dos espacios afines. Una aplicacion / : A —> A' se dice que 
es una aplicacion afm si existe un punto O £ A tal que la aplicacion lineal 
7 : V —> V", donde V y V' son los espacios vectoriales asociados a los espacios 
afines Ay A', respectivamente, verifica (Olt) = f(0)f(X) , VX € A. 

La aplicacion 7 se dira la aplicacion lineal asociada a /. 


El siguiente resultado muestra que la aplicacion lineal asociada no depende 
de la eleccion del punto O. 


— Q 


1 

Si / es una apli 

;acion affn, entonces la aplicacion lineal asociada verifica 
,VA,Be A. 

/ (AB) = f(A)f(B) 


Demostracion: 

Dado que A l) = ()/) — () A y que es lineal, 

7(A$) =7(pi) -7(0, 1) = f(0)f(B) - f(0)f(A) = f(A)f(B) 


De la definicion de aplicacion affn se sigue que esta solo depende de la imagen 
de un punto O dado y de la aplicacion lineal asociada, pues de la expresion 
7(o7) = f(o)f(x], se sigue que 


f(X) = f(0) + 7(d2) 


(9.2) 


□□H Matriz de una aplicacion afm 

Consideremos dos sistemas de referenda 1Z = {0\B} y 1Z' = 
de los espacios A y A', respectivamente. De la expresion (9.2), conocidas 
las coordenadas del punto f(0)(ci, ..., y la matriz de la aplicacion 

lineal 7 en l as bases B y BA M = (ay ), se tiene que si X(x±,... ,a ; n )n y 
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f(X)(yi, ■ ■ ■, Vm)n', entonces 



que en formato abreviado escribiremos como f(X) = f(0) + MX. La expresion 
matricial anterior puede ser escrita del siguiente modo 



se denomina matriz asociada a la aplicacion f respecto de los sistemas de 
referenda 1Z y TV. 


Dado un vector fijo v, consideremos la aplicacion afin / : 


r definida 


por 


/(P) = P + v 

es decir, la aplicacion afin cuya aplicacion lineal asociada es la identidad. Esta 
aplicacion afin es una traslacion de vector v, es decir, a cada punto le asocia el 
trasladado por el vector v. 

Veamos cual es la aplicacion lineal asociada ~f. Dado dos puntos P y Q, al 
trasladarlos mediante el vector v se tiene que f(P) = P + v y f(Q) = Q + v. 
Por tanto 

f(PQ) = f(P)M) = PQ 

de manera que es la aplicacion identidad. Ademas, la imagen del origen O 


es 


f(0) = O + v 

asf pues, la matriz de esta aplicacion es 



0 

V 

i 
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Encontrar la ecuacion de la simetrfa respecto del piano de ecuacion 


x + y — z = 1 

En primer lugar calcularemos la matriz de la aplicacion lineal asociada. Para 
ello, consideramos la simetrfa correspondiente a la direction de la variedad affn 
dada, esto es, el subespacio x\ + X 2 — £3 = 0. Para calcular la matriz de esta 
simetrfa procedemos corno en el ejemplo 5.5, obteniendo en primer lugar una 
matriz respecto de una base adecuada y posteriormente realizando un cambio 
de base. Asf, la matriz de la aplicacion lineal en la base canonica es 



lo que significa que la matriz de la aplicacion affn que buscamos sera de la forma: 



y para calcular los coeficientes ci, C 2 y C 3 bastara conocer la imagen de cualquier 
punto de la aplicacion; por ejemplo, como cualquier punto del piano x+y — z = 1 
es fijo, se tendra que /(1, 0, 0) = (1, 0, 0). Imponiendo esta condition resulta que 

ci + | = 1 , c 2 - | = 0 , c 3 + | = 0 
es decir, la simetrfa buscada tiene por ecuaciones 

f(x, y, z) = | (2 + x - 2 y + 2z, 2 - 2x + y + 2 z, —2 + 2x + 2y + z) 


□ 3 - 

APLICACION: MOVIMIENTOS RIGIDOS 

Intuitivamente, el concepto de movimiento es el de una aplicacion que 
“mueve” los objetos en el piano o el espacio sin modificar su forma. En el 
contexto de las aplicaciones afines, los movimientos se definen de forma clara y 
precisa a traves de sus aplicaciones lineales asociadas. Un movimiento rigido es 
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una aplicacion affn cuya aplicacion lineal asociada es lo que se denomina una 
isometria o aplicacion ortogonal. Las aplicaciones ortogonales son aquellas que 
conservan el producto escalar, es decir 

<u,v) = <7(u,7(v)> 


lo cual se traduce facilmente (vease ejercicio 19) en conservation de distancias, 
esto es: _ 

\\PQ\\ = \\7(PQ)\\ 


Desde un punto de vista intuitivo, esta claro que una aplicacion afm asociada a 
una isometria hara que los objetos se transfornren sin variar las distancias entre 
sus puntos, lo cual se traduce logicamente en que la aplicacion lo unico que hace 
es modificar la situation espacial del objeto. 

El nombre de aplicacion ortogonal para denominar a este tipo de aplicacio¬ 
nes lineales no es casual. Resulta que si consideramos una base ortonormal, la 
matriz de una aplicacion ortogonal respecto de esa base resulta ser una matriz 
ortogonal, esto es, = A T (cf. Definition 8.5). Tales matrices tienen pro- 
piedades muy interesantes: por ejemplo, es muy facil comprobar que si A es la 
matriz de una isometria, entonces |ti| = ±1; y aun mas, los autovalores de una 
isometria tienen siempre modulo (o valor absoluto, en caso de que sean reales) 
igual a 1. 

De este modo, es sencillo identificar todas las posibles isometrias tanto en 
el piano como en el espacio. Por ejemplo, en R 2 , como los autovalores tiene 
que ser 1, — 1 o un complejo de modulo 1, el cual puede escribirse en la forma 
cos a + isena, entonces la forma de Jordan (real) de una isometria tiene que 
corresponder a alguna de las siguientes: 





cos a sen a 
. — sen a cos a, 


Por tanto, las aplicaciones afines que son movimientos en el piano tendran que 
tener como aplicacion lineal asociada alguna de los cuatro tipos anteriores. 

Para caracterizar las aplicaciones afines que corresponden a movimientos 
hemos de prestar atencion a sus puntos fijos. Un aplicacion afin / : A A 
tiene un punto fijo P si f(P) = P. Por (9.2), f(P) = f(0) + MP , donde M es 
la matriz de la aplicacion lineal asociada. Esta claro entonces que en un punto 
fijo se debe cumplir [M — I 2 )P = —f(0 ), donde I 2 es la matriz identidad. Este 
sistema tendra solution, segun el Teorema de Rouche-Frobenius, si 

rango (M - I 2 ) = rango(M — I 2 \ - f(0)) 

Notese entonces que si rango(M — I 2 ) = 2, el sistema tendra siempre un 
punto fijo, lo que se puede dar en los casos 

( —1 0\ ( COSO sencA 

0 —1 J y—sena cos a) 
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El unico moviento piano con un punto fijo es un giro de centro el punto fijo y 
angulo a (figura 9.1a). Notese que si a = 7r, ambas matrices coinciden. 

Si rango(M —/ 2 ) = 1, lo cual corresponde necesariamente a que la isometria 
tenga corno forma de Jordan 

1 0 
0 -1 

entonces, si hay puntos fijos, entonces debe haber infinitos, generando una 
variedad lineal de dimension uno, esto es, una recta. El unico movimiento del 
piano con una recta de puntos fijos es la simetria de eje clicha recta (figura 9.1b). 
Tambien podrfa ocurrir que para rango(M — J 2 ) = 1 no existieran puntos fijos 
(aunque la isometria siga siendo la misma); en este caso, lo que tenemos es una 
simetria con deslizamiento (figura 9.1c). 

Por ultimo, si la forma de Jordan de la isometria corresponde a la matriz 
identidad, entonces esta claro que rango (M — I 2 ) = 0, y aquf caben dos 
posibilidades: o bien todos los puntos son fijos, es decir, el movimiento es la 
identidad, o bien no existe ningun punto fijo, lo que significa que el movimiento 
es una traslacion (figura 9.Id). 


mm - 

CALCULO CON PYTHON 


Aunque los calculos involucrados en este tema no requieren de la introduc¬ 
tion de nuevas herramientas de Python, mostraremos en esta section nuevas 
instrucciones para manejar matrices que nos ayudaran a resolver algunos ejem- 
plos sencillos. 

Comencemos calculando las coordenadas de un mismo punto en dos sistemas 
de referenda distintos: dados 1Z = {0;B} el sistema de referenda cartesiano y 
TV = {O'; B'}, donde 

O'i 1,1,0), B' = {(1,0, -1), (1,1,0), (0,0,1)} 


para calcular las coordenadas del punto (1,2,3)^ respecto de 1Z' hemos de 
construir la matriz del cambio de base de TZ' a 1Z de (9.1): 


>>> from numpy import matrix,concatenate,zeros,bmat,r_,dot 
>>> A=matrix(’1 0-1; 1 1 0; 0 0 l’).T 

>>> H=concatenate((zeros((1,3)),A)) 

>>> M 


5 

matrix ( [ [ 

0. , 

0. , 

0 

], 

6 

[ 

1. , 

1 . , 

0 

], 

7 

[ 

0. , 

1 . , 

0 

], 

8 

[- 

-1 . , 

0. , 

1 

]]) 


>>> a=concatenate((bmat(r_[l,1,1,0]).T,M),1) 
>>> a 
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(a) Rotation 


(b) Simetria 




(c) Simetria con deslizamiento 


(d) Traslacion 


Figura 9.1: Movimientos en el piano 
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11 

matrix([[ 

1. , 

0. , 

0. , 

0.] , 

12 

[ 

1. , 

1 ■ , 

1., 

0.] , 

13 

[ 

1. , 

0. , 

1., 

0.] , 

14 

[ 

0 . , 

-1. , 

0. , 

1.]]) 


En este caso hemos construido la matriz de cambio de sistema de referenda 
usando nuevas instrucciones de NumPy, como concatenate, que se usa para 
unir dos matrices. En la linea 3 adjuntamos una fila de ceros a la matriz M del 
cambio de base (formada por los vectores de B' por columnas), mientras que en 
la linea 9, hemos adjuntado a la matriz M una colunma formada por un 1 y las 
coordenadas de O'. Notese que hemos usado la funcion r_ seguida de una lista 
para crear un arreglo; es decir, la orden r_ [1,1,1,0] es equivalente a escribrir 
array ([1,1,1,0]). Luego convertimos este arreglo en matriz con la funcion 
bmat. Observese tambien que para adjuntar una colunma, en lugar de una fila, 
usarnos un segundo parametro opcional en la instruction concatenate. 

Para transformar coordenadas nos bastara multiplicar la matriz de cambio 
por el vector (1,1, 2,3) 


15 

>>> dot(a,r_ [1 , 1 

2 , 3 ]) 


16 

matrix( [ [ 1 . , 4 

, 3 . , 

2.]]) 


es decir, (1, 2, 3 ) 7 ?. = (4, 3, 2 ) 7 ?,/. 

Estas instrucciones para manejar matrices estan disponibles solo en NumPy. 
Para realizar algo similar con SymPy hemos de usar las funciones row_join y 
col_join. Por ejemplo, podemos construir la matriz del ejemplo 9.8 del siguiente 
modo: 


1 

>>> from sympy import Matrix,eye,zeros 

2 

>>> from numpy import r_ 

3 

>>> f = Matrix(r_[ 1 ]) .row.join(zeros (( 1 , 3 ))) 

4 

>>> v = Matrix(r_ [1 , 3 , 2 ]) .T 

5 

>>> A = f.col_join(v.row_join(eye ( 3 ))) 

6 

>>> A 

7 

1-1 

O 

O 

O 

T—1 

1_1 

8 

1-1 

O 

O 

T—1 

T—1 

1_1 

9 

1-1 

O 

T—1 

O 

co 

1_1 

10 

[2, 0, 0, 1] 


Tambien podemos aprovechar el manejo de expresiones simbolicas con el 
modulo SymPy para obtener la ecuacion de un piano que pasa por los puntos 
(1,0,0), (2,0,—1) y (1,1,2), segun hemos visto en (iv) del Ejemplo 9.2, 

1 >>> from sympy import symbols.Matrix 

2 >>> x , y,z = symbols (’ xyz ’) 

3 >>> A = Matrix([[x-l,y,z] , [ 1 , 0 ,- 1 ] , [ 0,1 , 2 ]]) 

4 >>> A 

5 [-1 + x, y , z] 
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6 


7 


i, o, -1] 
0 , 1 , 2 ] 


8 >>> A.det () 

9 -1 + x + z - 2*y 


□ 1 - 

EJERCICIOS 

Ejercicios de repaso 

|3| Se considera en un espacio afin A, el sistema de referenda cartesiano 
TZ = {O; {ui, u 2 }} y otro sistema de referenda TZ' = {O'; {vi, v 2 }}, con 0'(1,2), 
vi = (2,2) y v 2 = (—1,2). Encontrar las ecuaciones del carnbio de sistema de 
referencia y la ecuacion de la recta r = x + y — 5 = 0 respecto de TZ'. 

13 En los siguientes apartados encontrar las ecuaciones de la recta: 

(a) Que pasa por los puntos P( 1,2, —1) y Q( 2,1, 3). 

(b) Pasa por el punto Q(0,1, —1,0) y tiene como direccion el subespacio 
generado por el vector (0,1, —1,1). 

(c) Paralela a la recta de ecuaciones x — y + z = 1, 2x + y = Q y que pasa por 
el punto P(0, 0, 0). 

1*1 Estudiar la posicion relativa de las rectas de ecuaciones 




r = 


|3| En los siguientes apartados hallar la ecuacion del piano que: 

(a) Pasa por los puntos A( 1,0, 0), B( 2, 0, —1) y C( 1,1, 2). 

(b) Pasa por el punto P(—1, 0,2) y es paralelo a las rectas del ejercicio 3. 

(c) Pasa por el origen y es perpendicular a la recta 


x + y — 2z = 1 
x — y + 3z = 0 


r = 


1*1 Halla la distancia del punto P(l,3, — 1) a la recta de ecuaciones pa- 
rametricas 


r = 


x = 21 
y = 2 — t 
z = 1 2t 
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y al piano TT = x + y + 2z = 0. 

12] Halla la distancia entre las variedades afines 


! x + 2 z -1 - t — 0 
x — y — 2t = 1 
x — t = 2 


r 2 = (0,3,2,1) + ((0,1,0,1)) 


|3| Encuentra las ecuaciones de las siguientes transformaciones afines de R 3 : 

(a) Simetrfa respecto del piano x + y + z = 1. 

(b) Simetrfa respecto de la recta de ecuaciones x = y = z. 

(c) Simetrfa respecto del punto (1, 0,1). 

IM En los siguientes apartados calcular la proyeccion ortogonal del punto P 


sobre la variedad L , donde 
(a) P(0,1, -2), L = x + y + z = 1 



(c) P(0,1, —1,2), L = 2x + y + z — t = 2 


Problemas 

12] En R 4 se consideran las variedades afines 


L\ = {(xi, x 2 , x 3 , Xa) £ R 4 : Xi + x 2 = 4, x 3 + X4 = a} 
L 2 = (3,2,2,-1)+ <(1,-2,2,1)} 


Hallar a para que L\ y P 2 tengan intersection no vacfa. 
|3l!l Estudiar la position relativa de los pianos 


7Ti = —3x + 3y — 4z = 6, 7r 2 = 4x — ky + 82: = 5 


en funcion de los valores del parametro k. 
| 3 || Dadas las rectas 



Se pide: 

(a) Calcula los valores de a que hacen que las rectas anteriores se corten en 
un punto P a determinar. 
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(b) Calcula la distancia del punto P a la recta de ecuaciones 

(x = 2 

\x + y — 2z = l 

(c) Calcula la perpendicular por P al piano que pasa por los puntos (0,1,0), 
(1,1,0) y (0,0,1). 

I3E! Hallar las ecuaciones de la transformacion afm que asocia a cada punto 
de R 2 su proyeccion ortogonal sobre la recta y = 2x. 

Calcula las ecuaciones de la proyeccion ortogonal sobre el piano de 
ecuacion x — 2y + z = 3. 

WEI Una homotecia de razon k =/= 0 es una transformacion afm cuya matriz de 
la aplicacion lineal asociada es kl n . Calcula las ecuaciones de una homotecia de 
razon 2 que transforma el punto (1, 2,1) en el punto (1, 3,1). ,[Puedes describir 
geometricamente que hace esta aplicacion? 

1313 Encontrar las ecuaciones de una aplicacion afm que transforma los 
puntos (0,0,0), (1,0, 0), (1,1, 0) y (1,1,1) en los puntos (1,1,1), (1, 2, 3), (1, 2,4) 
y (0,0,0), respectivamente. 

Ejercicios teoricos 

WM Dados n+ 1 puntos Po, Pi, ..., P„, probar que los vectores P 0 Pi,PiPl,. .., 
P 0 P„ son linealmente dependientes si y solo si, para cualquier i = 1,..., n los n 
vectores P^Po, Pi Pi, ... ,PiP n tambien lo son. 

BU En R 2 considera un punto P(xq, yo) y una recta r = ax + by + c = 0. 
Deducir la formula de la distancia del punto P a la recta r. 

Wta En R 2 se consideran las rectas r = ax + by+ c = 0ys = ax + by+ d = 0 } 
con c d. Probar que las rectas son paralelas y encontrar una expresion que 
proporcione la distancia entre ellas. 

Ejercicios adicionales 

|3£| Probar que una aplicacion lineal es ortogonal si y solo si conserva las 
distancias. 

ISQI Identificar la aplicacion afin de matriz 



|23 Construir las matrices de los siguentes movimientos: 
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(a) Una traslacion de vector (2,3). 

(b) Un giro de centra el punto (1,3) y angulo f. 

(c) Una simetria de eje la recta x — y = 2. 
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A Conceptos generales 


\ 


En este apendice tratamos de incluir una serie de nociones basicas que se 
suponen conocidas por el lector y que incluimos aquf a rnodo de repaso. En 
esencia recordaremos brevemente algunos conceptos de teorfa de conjuntos, 
funciones y estructuras algebraicas, y veremos con mas detalle el Principio de 
Induction que es usado en diversas demostraciones a lo largo del texto. 

□ □ - 

TEORIA DE CONJUNTOS 

Las nociones que siguen a continuation seran presentadas de forma “intui- 
tiva”, dado que una profundizacion en algunos de los conceptos que vamos a 
mostrar queda fuera del alcance de este texto. 

El lector estara familiarizado con el simbolo logico de implication, =>, que 
relaciona una afirmacion con su consecuencia. La proposition p => q, que se lee 
si p entonces q, significa que si la afirmacion p es cierta, entonces la afirmacion 
q tambien lo es. Por ejemplo, 

si llueve entonces la calles se mojan 

En este caso se dice que p es una condition suficiente para q, mientras que q 
se dice condition necesaria para p. Es importante senalar que si la afirmacion 
p no es cierta, no se puede deducir nada sobre la veracidad de q (si no llueve, 
las calles podrfan estar o no mojadas —por ejemplo, podrfan haber regado—). 
Pero si q es falsa, entonces p no puede ser cierta (si las calles no estan mojadas 
es porque no ha llovido). 

Debemos recordar la cliferencia entre la implication simple y la doble impli¬ 
cation p q, que se lee p si y solo si q, y que significa 

p=> q y q=>p 

simultaneamente. En este caso se dice que p es una condition necesaria y 
suficiente para q, o que p y q son equivalentes. 

El lector tambien debe conocer el concepto de conjunto y de elemento, asf 
como la relation de pertenencia a un conjunto, que denotamos por x £ A, y que 
significa que el elemento x esta en el conjunto A. La no pertenencia se denota 
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por x ^ A. Recordamos tambien la notation habitual para un conjunto formado 
por una serie de elementos: 

A = {a, 6 , c, d} (A.l) 

Una coleccion de elementos de un conjunto se dice que forma un subconjunto , 
y en tal caso usamos la notation de inclusion , B C A, para decir que todo 
elemento del conjunto B esta en A. La inclusion estricta se denota por B C A 
y significa que todo elemento de B esta en A, pero hay elementos de A que no 
estan en B. Observese que si A es el conjunto dado en (A.l) entonces podemos 
escribir 

a € A, be A, {b} C A , {a,c} C A 

pero no {6, c, d} e A. Asimismo, el lector podra entender de inmediato la 
siguiente afirmacion: 

AcByBcA<^A = B 

Recordamos tambien la notation para el conjunto vaci'o 0, y que se verifica que 
0 C A para cualquier conjunto A. 

El conjunto formado por todos los subconjuntos de un conjunto A (incluidos 
el conjunto vacio y el propio conjunto) se denomina partes de A y se denota por 
V{A). 

Usaremos a lo largo de todo el texto los cuantificadores V y 3, asf como la 
negation de este ultimo $, y cuyos signihcados se muestran en los siguientes 
ejemplos: 

p{x), \/x e A se lee, p(x) para todo a; de A 

y significa que la propiedad p(x) se tiene para cualquier elemento x del conjunto 
A. 

3 x e A: p[x) se lee, existe i en A tal que p(x) 

quiere decir que existe al menos un elemento x del conjunto A para el que la 
propiedad p(x ) se tiene. 

Notese que: 

$x e A : p(x) •£=> p(x) es falso Mx e A 

es decir, no hay ningun elemento de A para el que la propiedad p(x) sea cierta. 

Es importante no confundir lo anterior con la negation de p(x ), \/x e A. Tal 
negation es equivalente a que 3 x e A tal que p(x) se curnple. 

Las operaciones entre conjuntos que usaremos son la union , AUB, que 
corresponde el conjunto de elementos formados por todos los del conjunto A y 
todos los del conjunto B , y la interseccion , AnR, que se forma con los elementos 
que esta a la vez en el conjunto A y en el B. Se usaran tambien las uniones e 
intersecciones genericas 

n 

U Ai = Ar U A 2 U • • • U An 

i =1 

n 

p| Ai = Ar n a 2 n • • • n A„ 

i =1 
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Por otro lado, la diferencia de conjuntos, A\B , esta formada por los elementos 
de A que no estan en B. Logicamente se tiene que 

B C A => A\B ± 0 

El producto cartesiano de dos conjuntos A y B, que se denota por A x B, 
se define corno el conjunto de pares ordenados de la forma (x, y) con x £ A e 
y £ B. La definition se puede extender a un numero mayor de conjuntos. 

Una relation R sobre un conjunto A es un subconjunto del producto car¬ 
tesiano A x A. Si x, y £ A son tales que el par (x, y) £ R, se representara por 
x Ry, y se dira que x esta relacionado con y por la relation R. 

Dada una relation R en un conjunto A, se dice que esta es 

■ reflexiva , si x Rx, Vx £ A 

■ simetrica , si x R y => y R x, Vx, y £ A 

■ antisimetrica si xRyyyRx=>x = y, Vx, y £ A 

■ transitiva, si x Ry y y R z ^ x R z, Vx, y, z £ A 

Una relation que sea reflexiva, antisimetrica y transitiva se dice relation de 
orden , o simplemente orden. Por ejemplo, la relation de inclusion entre conjuntos 
(c) es un orden en el conjunto V(A). La relation de desigualdad entre numeros 
(<), bien conocida por el lector, tambien es una relation de orden. Cuando 
existe una relation de orden en un conjunto se dice que este es ordenado. 

Una relation R sobre un conjunto A se dice de equivalencia si es reflexiva, 
simetrica y transitiva. Si x Ry con R una relation de equivalencia, se dice que x 
es equivalente a y y se suele usar la notation x ~ y. Dado x £ A, e 1 conjunto de 
elementos de A que son equivalentes a x se denomina clase de equivalencia de x. 
El conjunto formado por todas las clases de equivalencia se denomina conjunto 
cociente y se denota por A/ 

nm - 

FUNCIONES 

Otro elemento fundamental con el que el lector probablemente estara fami- 
liarizado es el concepto de aplicacion entre conjuntos. 

Dados S y T dos conjuntos, toda correspondencia que asocia a cada elemento 
de S un y solo un elemento de T se denomina aplicacion de S en T. A S' se 
le llama espacio de partida o espacio origen y a T espacio de llegada o espacio 
imagen. 

La notation habitual para una aplicacion es la siguiente: 

/ : S —> T 

s — > f(s ) = t = imagen por f de s 
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Cuando S y T son conjuntos numericos se habla habitualmente de funcion. 

Asociada a una funcion existen una serie de conjuntos y propiedades impor- 
tantes; en concreto, si / : S —> T una aplicacion, entonces: 

(i) Se define el dominio de /, como el conjunto 

Dom(/) ={s€S: 3/(»)} 


(n) Se denomina imagen de /, al conjunto 

Im(/) = {t £ T : 3s G S tal que f(s) =t} = {/(s) : s £ S} = f(S) 

(in) Si Im(/) = T, es decir, si Vt £ T, 3s £ S con f(s) = t, se dice que / es 
sobreyectiva o sobre. 

(iv) / es inyectiva si 

/0) = /(s') => s = s' 

(v) f se dira biyectiva si es sobre e inyectiva. 


Ademas existe una operation fundamental con las aplicaciones, la composi¬ 
tion, que se define del siguiente modo: si f : S —t T y g : T —> U son tales que 
Im(/) C Dom(( 7 ) se define la composition de / con g, que se notara (go f), por: 


( 50 /): S > U 

s —» g(f(s)) 

Es facil demostrar que la composition de aplicaciones inyectivas es inyectiva, 
la composition de aplicaciones sobreyectivas es sobreyectiva, y obviamente, la 
composition de aplicaciones biyectivas es biyectiva. 

Finalmente, dada una aplicacion / : S —> T, se denomina inversa de / a 
toda funcion g : T —> S tal que 

(. g°f){s)=s , (fog)(t)=t 

Se notara g = / -1 . Es importante observar que la inversa no siempre existe. En 
caso de que exista se dira que / es invertible. 


□ B - 

ESTRUCTURAS ALGEBRAICAS 

Se denomina operation (interna ) sobre un conjunto A a una aplicacion 

* : A x A —> A 

que a cada par de elementos (x, y) G A x A le asocia un elemento x * y £ A. 
Es decir, una operation consiste esencialmente en “liacer algo” con un par de 
elementos de un conjunto para “producir” un nuevo elemento del conjunto. 

Se dice que una operation * es: 
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■ conmutativa , si x * y = y * x, Vx, y £ A 

■ asociativa , si x* (y-k z) = (x ky) k z, Vx, y,z £ A 

Decimos que e es un elemento neutro para la operation *. si x * e = e * x = x, 
Vx e A. 

Si la operation * posee elemento neutro e, dado i£lse dice que x' £ A es 
su simetrico (tambien llamado opuesto o inverso ) si x * x' = x' * x = e. 

Cuando en un conjunto tenemos dos operaciones + y *, se dice que * es 
distributiva por la izquierda respecto de + si 

x * (y + z) = x*y + x*z, Vx, y,z £ A 

o distributiva por la derecha respecto de + si 

(y + z)*x = y*x + z*x, Vx, y,z £ A 

Obviamente, si * es conmutativa y distributiva respecto de + por alguno de los 
lados, lo sera por el otro. 

Una estructura algebraica debe entenderse corno una “etiqueta” con la que 
se trata de identificar las propiedades que ciertas operaciones poseen en un de- 
terminado conjunto. El principal interes en trabajar con estructuras algebraicas 
estriba en el hecho de que las propiedades que se pueden deducir a partir de la 
estructura son independientes de la naturaleza de los elementos del conjunto en 
cuestion. 

Si A es un conjunto y + es una operation asociativa y que posee elemento 
neutro y elemento simetrico, se dice que el par (A, +) es un grupo. Si ademas la 
operation es conmutativa, se dice que es un grupo conmutativo. 

Si en A tenemos dos operaciones, + y *, tales que {A, +) es un grupo 
conmutativo, la operation * es asociativa y distributiva respecto de + tanto 
por la izquierda como por la derecha se dice que la terna ( A , +, *) es un anillo. 
El anillo es conmutativo si la operation * lo es, y se dira que es un anillo unitario 
si la operation * posee elemento neutro. 

Por ejemplo, el conjunto de numeros enteros Z es un anillo conmutativo y 
unitario. 

Por ultimo, un conjunto A dotado de dos operaciones + y • tales que ( A , +, •) 
es un anillo y (A* , •) es un grupo, donde A* = A\{0}, siendo 0 el elemento neutro 
para la operation +, se dice cuerpo. 

Los ejemplos tipicos de cuerpos que el lector probablemente conoce son Q, 
el conjunto de numeros rationales, y K, el conjunto de numeros reales. 


□ O - 

PRINCIPIO DE INDUCCION 

El Principio de Induccion es una tecnica de demostracion que se usa en varias 
ocasiones a lo largo del texto y que permite probar propiedades vinculadas de 
algun modo con el conjunto de numeros naturales N. 
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Funciona del siguiente modo: si se pretende demostrar que una cierta pro- 
piedad p(n) es cierta para todo numero natural n £ N, entonces es necesario 
probar: 

(i) p{ 1) es cierto 
(il) p(n) => p(n + 1) 

Podemos tratar de entender el mecanismo si pensamos, por ejemplo, en 
subir una escalera. Para recorrer toda una escalera solo necesitamos realizar 
dos acciones: la primera y mas evidente es llegar al primer escalon (lo que 
identificamos con probar que la propiedad es cierta en el caso n = 1, esto es, 
que p( 1) se cumple); la segunda consiste en, estando en un determinado escalon, 
saber llegar al escalon inmediatamente superior, es decir, si la propiedad en el 
caso n es cierta, hemos de poder probar que tambien es cierta en el caso n + 1 
(lo que denotamos con p(n) => p{n + 1)). Como hemos llegado al nivel n es 
irrelevante aqui; lo que realmente importa es ver como llegar del nivel n al nivel 
ra + 1, es decir, como se sube de un escalon al siguiente. 

Debe ser ahora evidente que si somos capaces de llegar al primer escalon, 
y sabemos como pasar de un escalon al siguiente, entonces podemos subir 
completamente la escalera, no importa cuan larga sea. Veamoslo con un ejemplo. 



(i) Probar que ^ i = 


i (n + 1) 


Es facil comprobar que la formula funciona para algunos valores de n: 

1 • 2 
2 

2 • 3 
2 

3-4 


n = 1 


n = 2 


1 = 


1 + 2 = 


n = 3 


1+2+3= 


sin embargo es muy importante tener claro que esto no constituye una 
demostracion del resultado (^corno podemos garantizar que la formula es 
valida para cualquier otro valor de n ?). Vamos a probar la formula por 
induction. El primer paso ya esta hecho (la formula es cierta para n = 1, 
como acabamos de comprobar); veamos el segundo: hay que probar que si 
la formula es cierta en el caso n, entonces tambien lo es en el caso n + 1. 
Escribamos como es la formula en el caso n - 

n+1 


£- 


(n + l)(n - 


h 1 : 

2 ) 


(A.2) 


i=1 
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Esta expresion es la que queremos demostrar, por lo que comenzaremos 
desde un miembro de la igualdad y trataremos de llegar al otro. Aqui' es 
importante senalar que estamos suponiendo que la formula es cierta en el 
caso n, es decir, que 

£,. = ri(n + l) (A.3) 

»= 1 

se tiene. Esto puede ser confuso para el lector, pues parece que asumimos lo 
que queremos probar, pero no debemos olvidar que lo que debemos hacer 
es demostrar los pasos que marca el principio de induccion. Por tanto para 
probar (A.2): 


n+1 


. , x Tlijl -|- 1) , x (71 l)(7l H - 2) 

E ? = zJ ? + ( n + 1 )= 9 + (n + 1) = --^-- 


i =1 


i=l 


Notese que en el primer paso hemos separado la surna hasta n + 1 en la 
suma hasta n mas el termino n + 1 y en el segundo paso usamos (A.3), a 
la que usualmente nos referiremos como hipotesis de induccion. 

(n) Probar la formula del binomio de Newton: 


(a + b) n 


n 


E 




donde recordemos que el numero combinatorio (^) se define por 


n\ n\ 

kj k\(n—k)\ 


Del mismo modo que antes, veamos en primer lugar que la formula es 
cierta para n = 1: en efecto, 



a + b 


Probemos ahora que si la formula es cierta en el caso n — 1, entonces 
tambien es cierta en el caso n. Notese que a diferencia del caso anterior 
en el que querfamos probar el caso n + 1 dando por supuesto el caso n, 
ahora queremos probar el caso n suponiendo el caso n — 1. El lector debe 
entender que ambas situaciones demuestran el mismo hecho. 

Asf pues, para probar el caso n, consideramos (a + b) n y lo escribimos 
como (a + 6) ra_1 (a + b ), de modo que, usando la hipotesis de induccion: 
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B Introduccion a Python 


Este tema no pretende ser un manual de uso de Python sino una breve 
introduccion al mismo que proporcione al lector un punto de partida a partir 
del cual pueda usar el lenguaje para abordar una buena parte de los calculos, 
en algunos momentos tediosos, que son precisos realizar a lo largo de este texto. 

Python es un lenguaje de programacion creado por Guido Van Rossum a 
finales de los ochenta. Su nombre deriva de la aficion de su creador al grupo de 
humor ingles Monty Python. Python es un lenguaje de alto nivel, interpretado, 
interactivo y de proposito general. Un lenguaje se dice de alto nivel cuando su 
lexico y estructura esta mas proximo al lenguaje humano que al lenguaje que 
entiende el computador. El lenguaje es interpretado cuando no necesita de un 
proceso de compilation. 1 En estos casos, el interprete lee las lfneas de codigo y las 
ejecuta una a una. Es interactivo porque proporciona la posibilidad de ejecutar 
codigo directamente sobre el interprete sin necesidad de escribir un programa, 
capacidad esta, que nos sera de especial utilidad a lo largo del texto, y es un 
lenguaje de proposito general puesto que es lo sufitientemente versatil corno 
para programar cualquier tarea que pueda realizarse con un ordenador. Como 
carta de presentation podemos decir que Python es uno de los tres lenguajes 
oficiales empleados en Google. 

Los lectores con conocimiento de algun lenguaje de programacion encon- 
traran en Python un lenguaje sencillo, versatil y que proporciona codigo facil- 
mente legible. Para aquellos que no estan familiarizados con la programacion, 
Python supone un primer contacto agradable, pues los programas pueden ser 
comprobados y depurados con facilidad, permitiendo al usuario concentrarse 
mas en el problema a resolver que en los aspectos concretos de la programacion. 

Python es software de codigo abierto que esta disponible en multiples pla- 
taformas (Linux, Unix, Windows, Mac OS, etc.), de manera que el mismo codi¬ 
go funciona en diferentes sistemas, 2 aunque para ello es preciso disponer del 
interprete. En este tema veremos algunos aspectos generales relacionados con la 
instalacion y uso del interprete, asf como las caracterfsticas basicas del lenguaje 
y los paquetes esenciales que nos seran de utilidad a lo largo del texto. 


1 Los lenguajes compilados precisan de un proceso de compilation (y posterior enlazado) 
que transforman el codigo escrito por el programador (el llamado codigo fuente) en un codigo 
ejecutable (binario). 

2 Con la excepcion de las extensiones que son especificas de cada sistema operativo. 
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□ a - 

INSTALACION DE PYTHON 

Python puede ser obtenido desde la pagina web del lenguaje. 3 El proceso de 
instalacion dependera del sistema empleado y no suele presentar complicaciones. 
Tanto en Windows como en Mac, bastara con bajar el instalador y ejecutarlo. 4 
En la mayorfa de distribuciones Linux, Python viene instalado por defecto o 
puede ser instalado facilmente con la herramienta de gestion de paquetes. 

Una de las principales virtudes de Python esta en la gran cantidad de exten- 
siones del lenguaje que posee. Estas extensiones suponen complementos adecua- 
dos para realizar de forma rapida y sencilla ciertas operaciones que no forrnan 
parte del micleo principal del lenguaje. Asf, en este texto trataremos dos exten¬ 
siones que nos seran de gran utilidad: NumPy y SymPy. La primera de ellas esta 
disenada para trabajar con calculo vectorial avanzado, mientras que la segunda 
incorpora a Python elementos de calculo simbolico que nos permitiran realizar 
operaciones matematicas con expresiones simbolicas y calculos exactos. Estas 
dos extensiones no vienen con la instalacion inicial de Python y deben ser ins- 
taladas posteriormente. Pueden ser descargadas desde numpy.org y sympy.org, 
respectivamente. 5 

EJH3 Primeros pasos 

Una vez instalado el interprete de Python podemos trabajar con el lenguaje 
de dos formas distintas: a traves de la consola o mediante la ejecucion de 
scripts de ordenes. El primer metodo es bastante util cuando queremos realizar 
operaciones inmediatas, y podemos compararlo con el uso de una calculadora 
avanzada. El uso de scripts de ordenes corresponde a la escritura de codigo 
Python que es posteriormente ejecutado a traves del interprete. 

Hay diversas formas de iniciar el interprete Python: en Windows lo haremos 
directamente abriendo la consola Python o el programa IDLE Python en el menu 
de programas, mientras que en Linux o Mac OS abriremos la ti'pica terminal y 
ejecutaremos la orden python. El resultado sera algo por el estilo: 

Python 2.6.5 (r265:79063, Apr 16 2010, 13:09:56) 

[GCC 4.4.3] on linux2 

Type "help", "copyright", "credits" or "license" for more 
inf ormation. 

>>> 


que nos informa de la version que tenemos instalada y nos senala el prompt 


,! www. python. org/download 

4 En las ultimas versiones de los sistemas Mac ya viene instalado por defecto. 

5 La descarga e instalacion en una distribution Ubuntu se hace sencillamente con la orden 
sudo apt-get install python-numpy python-sympy 


»> 


del sistema, el cual indica la situation del terminal a la espera de ordenes. 
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Podemos salir con la orden exit() o pulsando las teclas Ctrl+D (en Linux y 
Mac) 6 Ctrl+Z y ^T| 6 (en Windows). 

Una vez dentro del interprete podemos ejecutar ordenes del sistema, por 
ejemplo 

>>> print "Hola Mundo" 

Hola Mundo 
>>> 


Obviamente la orden print imprime la cadena de texto o string Hola Mundo 
que va encerrada entre comillas para indicar precisamente que se trata de un 
string. Una vez ejecutada la orden, el sistema vuelve a mostrar el prompt. 

La otra alternativa a la ejecucion de ordenes con Python es la creation de 
un script o guion. Se trata de un archivo de texto en el que listamos las ordenes 
Python que pretendemos ejecutar. Para la edition del archivo nos vale cualquier 
editor de texto sin formato. Escribiendo el comando 


print "Hola Mundo" 


en un archivo, 7 lo salvamos con un nombre cualquiera, por ejemplo hola.py. 
Desde Windows podemos ejecutar el script haciendo doble click sobre el archivo 
en cuestion, lo que ocurre es que se mostrara el resultado en una ventana de 
comandos rapidamente y esta se cerrara, lo cual no nos permitira ver nada. Esto 
puede se arreglado anadiendo al fichero la orden raw_input (), que hara que el 
programa se quede a la espera de una entrada por teclado para cerrarse despues. 

En los sistemas Linux o Mac, podemos ejecutar el codigo sencillamente 
escribiendo en una consola la orden python hola.py (obviamente situandonos 
correctamente en el path 8 ). Tambien es posible hacer ejecutable el codigo Python 
escribiendo en la primera linea del archivo 9 

#!/usr/bin/env python 


y dando permisos de ejecucion al archivo con la orden chmod a+x hola.py desde 
una consola. En tal caso podemos ejecutar con un doble click sobre el archivo o 
escribiendo ./hola.py en una consola. 

Se pueden utilizar codificaciones diferentes de la ASCII 10 en los scripts de 
Python anadiendo, justo detras del shebang la linea 

6 El sfmbolo J denotara la tecla Enter o retorno de carro. 

7 Para diferenciar la escritura de ordenes en el interprete de los comandos que introducire- 
mos en los archivos ilustraremos los ultimos con un marco doble. 

8 El path o ruta de un archivo nos indica la localizacion de este dentro del sistema de 
archivos. 

9 Esto es lo que se conoce como el shebang, y es el metodo estandar para poder ejecutar un 
programa interpretado como si fuera un binario. 

1 0 Es decir, codificaciones que admiten caracteres acentuados. 
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# coding: codificacion -*- 


donde codificacion se refiere al codigo de caracteres que empleemos (tfpicamente 
utf-8 en Linux o Mac). El empleo de caracteres no ASCII en un script sin esta 
linea produce errores. 

mam La consola iPython 

En lugar del interprete Python habitual existe una consola interactiva deno- 
minada iPython con una serie de caracterfsticas muy interesantes que facilitan 
el trabajo con el interprete. 11 

La principal virtud de esta consola es la presencia del autocompletado , 
caracteristica que se activa al pulsar la tecla de tabulation y que nos permite 
que al teclear las primeras letras de una orden aparezcan todas las ordenes 
disponibles que comienzan de esa forma. Tambien existe un operador ? que 
puesto al final de una orden nos muestra una breve ayuda acerca de dicha 
orden. Ademas, esta consola pone a nuestra disposition comandos del entorno 
(cd, Is, etc.) que nos permiten movernos por el arbol de directorio desde dentro 
de la consola, y el comando run con el que podemos ejecutar desde la consola 
un script de ordenes. 

HB - 

ASPECTOS BASICOS DEL LENGUAJE 

BBH Variables y tipos de datos 

En un lenguaje de programacion, una variable es un sfmbolo que representa 
algun tipo de dato, ya sea un numero entero, un numero real, una cadena de 
caracteres, etc. Python es lo que se conoce como un lenguaje dinamicamente 
tipado , es decir, las variables pueden cambiar de tipo en distintos momentos sin 
necesidad de ser previamente declaradas. Las variables son identihcadas con un 
nornbre, mediante el cual podemos acceder al dato que almacenan o modificarlo. 
Los nombres de variables deben obligatoriamente comenzar por una letra y hay 
distincion entre mayusculas y minusculas. 

Los tipos de datos que usaremos en este texto son los numeros enteros (int), 
reales en doble precision (float), complcjos (complex), cadenas de caracteres 
(str) y listas (list). 

Las variables se definen con el operador de asignacion =; por ejemplo 

>>> a=2 
>>> b=5. 

>>> c =3 +1j 


11 Se puede descargar desde ipython.scipy.org. 
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define las variables a, b y c como un entero de valor 2, un real de valor 5 y 
un numero complejo de valor 3 + i, respectivamente. Observese la necesidad de 
poner un punto para definir el valor como real y no como entero y el uso de j 
en lugar de i en el numero complejo, asi como la obligation de anteponer un 
numero. Tambien se puede declarar un numero complejo del siguiente modo: 

>>> complex(3,2) 

(3 + 2j ) 


Podemos recuperar el tipo de dato de cada variable con la orden type, 

>>> type(a) 

<type ’int ’ > 

>>> type(b) 

<type ’float ’ > 

>>> type(c) 

<type ’complex’> 

Como vemos, Python asigna el tipo a cada variable en funcion de su definition. 
Es importante resaltar la diferencia entre los tipos numericos, pues si no somos 
cuidadosos podemos caer en el siguiente error: 

>>> a=5; b=2 
>>> a+b 
7 

>>> a/b 
2 


Observese que hemos definido las variables a y b en la misma lfnea, separadas 
por ;. Claramente a+b calcula la suma de los valores de las variables, sin embargo 
a/b parece que no calcula correctamente la division. En realidad la respuesta 
es correcta dado que ambas variables son enteros, y por tanto se realiza la 
division entre enteros, que corresponde a la parte entera de la division. Si lo 
que esperamos es obtener la division real debemos escribir al rnenos uno de los 
numeros en forma real, lo que se hace con el comando float 

>>> a/float(b) 

2.5 


Cuando Python opera con numeros de distinto tipo, realiza la operation trans- 
formando todos los numeros involucrados al mismo tipo segun una jerarqufa 
establecida que va de enteros a reales y luego a complejos. Observese el siguien¬ 
te ejemplo: 

>>> a=3. 

>>> b=2+3j 
>>> c=a+b 
>>> c 
(5 + 3j ) 
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>>> type(c) 

<type ’ complex ’ > 


Como vemos, la operacion de suma entre un real y un complejo se realiza 
correctamente como suma de numeros complejos y el resultado corresponde 
a un numero de ese tipo. 

Las cadenas no son mas que texto encerrado entre comillas: 

>>> a="Hola" 

>>> b=’mundo’ 

>>> a 
’Hola ’ 

>>> b 
’mundo’ 

>>> type(a) 

Ctype ’ str ’ > 


en las que se puede comprobar que da igual definirlas con comillas simples o 
dobles. 

Por ultimo, 12 las listas son colecciones de variables de cualquier tipo (inclu¬ 
sive listas). Observese el siguiente ejemplo: 



Hemos definido una lista encerrando sus elementos (de tipos diversos) entre cor- 
chetes y separandolos por comas. Podemos acceder a cada uno de los elementos 
de la lista escribiendo el nornbre de la lista y el indice del elemento entre corche- 
tes, teniendo en cuenta que el primer elemento tiene indice 0. Si algun elemento 
de la lista es otra lista, podemos acceder a los elementos de esta ultima usando 
el corchete dos veces, como en el siguiente ejemplo: 

>>> a=[1 ,2. , 3 + 1 j ,"hola " ] 

>>> milista=[1,2,a] 

>>> milista 

[1, 2, [1, 2.0, (3+1j) , ’hola’]] 

>>> milista [2] [3] 

12 Hay mas tipos de datos en Python, pero de momento solo usaremos los aquf descritos. 
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’hola ’ 


QH|j| Operadores 

Las operaciones numericas mas comunes se realizan en Python con los ope¬ 
radores + (surna), - (resta), * (multiplicacion), / (division) y ** (potentiation). 
Tambien existe el operador // (division entera), que da la parte entera de la 
division entre dos reales y el operador 7 0 (modulo), que proporciona el resto de 
la division entre dos numeros. 


Los operadores suma y multiplicacion pueden aplicarse a cadenas y a listas, 
como vemos en el siguiente ejemplo: 



Pero adernas, con las listas disponemos de operadores que nos permiten acceder 
no solo a elementos concretos de la lista, sino a trozos, lo que se denomina 
slicing. Veamos el siguiente ejemplo en el que se usa el comando range, cuyo 
funcionamiento es claro: 

>>> a=range(10) 

>>> a 

[0, 1, 2 , 3, 4, 5, 6, 7 , 8, 9] 

>>> a [2:6] 

[2, 3, 4, 5] 

>>> a [ :3] 

[ 0 , 1 , 2 ] 

>>> a [7:] 

[7, 8, 9] 

Notese como el operador de slicing inicio:fin permite recuperar una parte de 
una lista entre los valores inicio y fin, sin contar este ultimo. Mas adelante 
veremos su utilidad en el manejo de submatrices. 


- 

BUCLES Y CONDICIONALES 


Las ordenes que vamos a ver en esta section estan orientadas a la escritura de 
scripts y a la realization de programas aunque tambien pueden usarse en el modo 
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interactive. Los bucles permiten ejecutar fragmentos de codigo repetidamente 
para una serie de valores. Una caracteristica esencial de Python es que la sintaxis 
del lenguaje impone obligatorianrente que escribamos con cierta claridad. Asi, 
el fragmento de codigo a repetir en un bloque for esta marcado por el sangrado 
de linear 


>>> for i in range (3) : 
... print i 

0 

1 

2 


La sintaxis de la orden for es simple: la variable i recorre la lista generada por 
range(3), finalizando con dos puntos (:) obligatoriamente. La siguiente linea, 
comenzada por . . . por el interprete, debe ser sangrada, bien con el tabulador, 
bien con espacios (uno es suficiente, aunque lo habitual es cuatro). A1 dejar la 
siguiente linea en bianco el interprete entiende que hemos finalizado el bucle 
for y lo ejecuta. En un script volveriamos al sangrado inicial para indicar el fin 
del bucle. 

Notese que el bucle en Python corre a traves de la lista y no de los indices 
de esta, conro se nruestra en el siguiente ejenrplo: 

>>> a=[’hola’,’mundo’] 

>>> for b in a: 

... print b 

hola 

mundo 


La escritura de sentencias condicionales es similar a la de los bucles for, 
usando el sangrado de linea para determinar el bloque 


V 

V 

V 

H- 

>2 

oo 

n 

ii 

0 : 


... print 

"4 

es divisible por 3" 

. . . else : 



. . . print 

"4 

no es divisible por 3" 

4 no es divisible 

por 3 


La orden if evalua la operation logica “el resto de la division de 4 entre 3 es 
igual a cero”, puesto que la respuesta es negativa, se ejecuta la segunda sentencia 
de inrpresion (else). Los operadores relacionales en Python son == (igual), ! = 
(distinto), > (mayor que), >= (mayor o igual que), < (menor que) y <= (menor o 
igual que), y los operadores logicos son and, or y not. 
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IDO - 

MODULOS 

Una de las principales caracterfsticas de Python es su extensa biblioteca 
que nos provee de funciones para realizar las tareas mas diversas. Esta modu¬ 
larization del lenguaje permite ademas que los programas creados puedan ser 
reutilizados con facilidad. Para cargar un modulo usamos la orden import: 

>>> import os 


En este ejemplo hemos cargado el modulo os (Operating System) que nos provee 
de funciones del sistema operativo con las que podemos, por ejemplo, movernos 
a un directorio. El comando dir (os) nos proporciona un listado de los objetos, 
atributos y funciones del modulo. Para usar cualquier funcion del modulo es 
preciso anteponer su nombre. Por ejemplo, 

>>> os.get cwd () 

’/home/usuario ’ 


nos proporciona una cadena de texto correspondiente al directorio en el que nos 
encontramos. 13 El comando chdir nos permite cambiar de directorio, tanto en 
forma absoluta como relativa, teniendo en cuenta que usamos la separation de 
directories con la barra usual (/) en todos los sistemas: 

>>> os.listdir(’.’) 

[’dirl’,’dir2’,’archivo’] 

>>> os.chdir(’dir1 ’ ) 

>>> os.get cwd ( ) 

’/home/usuario/dir1’ 


Python esta disenado para ser usado a traves de modulos, es decir, solo 
unas pocas funciones son cargadas con el nucleo principal, y para acceder a 
calculos comunes, como por ejemplo la rafz cuadrada (sqrt), es necesario cargar 
el modulo apropiado. 

Notese que para usar las funciones del modulo cargado hemos de anteponer 
el nombre del modulo seguido de un punto. Podemos evitar el tener que hacer 
esto si cargamos los modulos del siguiente modo: 

>>> from math import * 


Con esta orden importamos todas las funciones del modulo math (basicamente 
las trigonometricas, logaritmo, exponential, ralz cuadrada, numero ^ r, etc.), las 
cuales estaran accesibles sin necesidad de anteponer el nombre del modulo. 
Ahora, si queremos calcular y/2, escribimos 


13 La respuesta en un sistema Windows podn'a ser algo similar a ’C:\\Python27’. 
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>>> sqrt (2) 

1.4142135623730951 


Logicamente, esta forma de cargar los modulos tiene ventajas evidentes en 
cuanto a la escritura de ordenes, pero tiene tambien sus inconvenientes. Por 
ejemplo, es posible que haya mas de un modulo que use la misrna funcion, como 
es el caso de la raiz cuadrada, que aparece tanto en el modulo math como en 
el modulo cmath. De manera que podemos encontrarnos situaciones como la 
siguiente: 


>>> import math 


>>> import cmath 


>>> math.sqrt(-1) 


Traceback (most recent 

call last): 

File "<stdin>", line 

1, in Cmodule > 

ValueError: math domain 

error 

>>> cmath.sqrt(-1) 





Como vemos, hemos cargado los modulos math y cmath y calculado la raiz 
cuadrada de — 1 con la funcion sqrt que posee cada modulo. El resultado es 
bien distinto: la funcion raiz cuadrada del modulo math no permite el uso de 
numeros negativos, mientras que la funcion sqrt del modulo cmath si. Si en 
lugar de cargar los modulos como en el ultimo ejemplo los hubiesemos cargado 
asi: 

>>> from math import * 

>>> from cmath import * 


^que ocurrira al hacer sqrt(-l)? Como el lector puede imaginar, la funcion 
sqrt del modulo math es sobreescrita por la del modulo cmath. por lo que solo 
la ultima es accesible. 

Existe una tercera opcion para acceder a las funciones de los modulos que 
no precisa importarlo al completo. Asi, 

>>> from math import sqrt 
>>> from cmath import cos,sin 


nos deja a nuestra disposition la funcion raiz cuadrada del modulo math y 
las funciones trigonometricas seno y coseno del modulo cmath. Es importante 
senalar que con estas funciones no tenemos acceso a ninguna otra funcion de los 
modulos que no hubiera sido previamente importada. 

Esta ultima opcion es de uso mas frecuente en los scripts , debido a que 
con ella cargamos exclusivamente las funciones que vamos a necesitar y de esa 
forma mantenemos el programa con el nn'nimo necesario de recursos. En el uso 
de la consola interactiva es mas frecuente cargar el modulo al completo, y es 
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aconsejable hacerlo sin el uso de *. De hecho, hay una posibilidad adicional que 
nos evita tener que escribir el nombre del modulo al completo, seguido del punto 
para usar una funcion. Si realizamos una importacion del modulo como sigue. 


>>> import math as m 

entonces no es necesario escribir math. para acceder a la funciones sino 


>>> m.cos(m.pi) 
- 1.0 


□ QH Funciones definidas por el usuario 

Las funciones son trozos de codigo que realizan una determinada tarea. 
Vienen definidas por la orden def y a continuacion el nombre que las define. 
Siguiendo la sintaxis propia de Python, el codigo de la funcion esta sangrado. 
La funcion hnaliza con la orden return. 

La principal caracteristica de las funciones es que permiten pasarles argu- 
rnentos de manera que la tarea que realizan cambia en funcion de dichos argu- 
mentos. 

>>> def mifuncion(x,y): 

. . . t = x**2 + y**2 

. . . return t 

>>> mifuncion (2,3) 

13 

>>> mifuncion(4,-1) 

17 


Del mismo modo, como puede verse en el ejemplo, las funciones pueden devolver 
valores a traves de la orden return. 

Aunque las funciones pueden ser definidas dentro del interprete para su uso, 
es mas habitual alnracenarlas en un fichero, bien para poder ser ejecutadas 
desde el mismo, o bien para ser importadas como si se tratara de un modulo. 
Por ejemplo, podemos dehnir una funcion matematica y guardarla en un archivo 
tang.py 

from math import sin,cos,pi 
def tangente(x): 
if cos(x) ! =0: 

return sin(x)/cos(x) 
else : 

print "La tangente es infinita" 
return 

x=tangente(pi) 

print ’La tangente de pi es’,x 
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Si ahora ejecutamos el archivo desde la consola: 


$ python tang.py 

La tangente de pi es - 1.22460635382e-16 


Aunque tambien podemos cargar la funcion tangente desde el interprete como 
si se tratara de un modulo : 14 


>>> from tang import tangente 
La tangente de pi es -1.22460635382e-16 
>>> tangente(3) 

-0.1425465430742778 


Notese como al cargar el modulo hacemos referenda al nornbre del fichero, y 
este es ejecutado. Posteriormente dispondremos de la funcion tangente para su 
uso. 


003 Funciones, metodos y atributos 

Aunque no es la intention de este texto introducir al lector en cuestiones 
relacionadas con la Programacion Orientada a Objetos, es inevitable usar en 
algun momento algo de su terminologia. De manera muy superficial podemos 
decir que los objetos equivalen a una especie de dato particular en Python, 
mientras que las funciones, los metodos y los atributos son esencialmente opera- 
ciones que pueden hacerse con estos objetos que tenemos a nuestra disposition. 
La diferencia entre unos y otros esta en la forma en la que se accede a ellos. Ya 
hemos visto en ejemplos anteriores como trabajar con las funciones. A diferencia 
de estas, los metodos y atributos no precisan importation, pues vienen definidos 
con el propio objeto. El siguiente ejemplo nos muestra la diferencia entre arnbos: 

>>> a = 3 + 2j 
>>> a.real 
3.0 

>>> a.conjugate 

<built-in method conjugate of complex object at 0xb7738968> 
>>> a.conjugate() 

(3-2j) 


Como vemos, el atributo real nos permite obtener la parte real del numero 
complejo definido en el objeto a. Si queremos obtener su conjugado, vemos que 
a.conjugate nos informa que eso es un metodo, pero no nos proporciona el 
valor esperado. Para ello hemos de usar la notation a. conjugate (). 


14 Hay que tener la precaution de situar el fichero tang.py donde el interprete pueda 
encontrarlo, por ejemplo en el directorio desde el que ejecutamos el interprete. 
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QQQ El modulo NumPy 

NumPy es un modulo fundamental para el calculo cientffico con Python, 
principalmente porque esta disenado para obtener un buen nivel de rendimiento 
(cercano a lo que pueden proporcionarnos lenguajes compilados como FORTRAN 
o C) cuando manejamos un gran numero de datos. Aunque en este texto no 
llevaremos a cabo calculos en los que el rendimiento pueda ser un factor a 
tener en cuenta, cualquier aplicacion avanzada en matematicas requiere de un 
tratamiento eficiente en los calculos, y en ese sentido NumPy es actualmente la 
option mas adecuada para ello. 

El modulo NumPy incorpora un nuevo tipo de dato, el array o arreglo, que 
tiene una estructura similar a una lista, aunque es mas restrictivo y compu- 
tacionalmente mucho mas eficiente. A diferencia de las listas, cuyos elementos 
pueden ser de cualquier tipo, un array de NumPy debe tener todos sus ele¬ 
mentos del mismo tipo. Para definirlo, obviamente sera necesario importar el 
modulo previamente, 

>>> import numpy as np 
>>> a = np.array( [1 ,4,9]) 

>>> a 

array(Cl, 4 ,9]) 


El acceso a los elementos del arreglo es identico al de las listas. Es muy 
importante tener presente el tipo de valores definidos en el arreglo, pues este 
no cambia al modificar los elementos de tipo. Es decir, el arreglo definido antes 
tiene todos sus elementos enteros, como podemos comprobar con el atributo 

dtype 

>>> a.dtype 
dtype( ’ int32 ’ ) 

La respuesta int32 se refiere a un tipo de entero. 15 Si ahora pretendemos 
modificar los valores del arreglo, podemos llevarnos alguna sorpresa 

>>> a [0]=3.6 
>>> a 

array( [3, 4 ,9]) 

Como vemos, al ser el arreglo entero, la modification del primer valor de este 
toma solo su parte entera. Si queremos que el arreglo admita valores reales, 
hemos de modificar previamente su tipo: 

>>> a=a.astype(float) 

>>> a 

array([ 3., 4., 9.]) 

ls En NumPy existen varios tipos de enteros, reales y complejos, en funcion del numero de 
cifras que queramos manejar. En todo este texto trabajaremos con los tipos que NumPy define 
por defecto. 
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>>> a [0]=3.6 
>>> a 

array ([ 3.6, 4., 9.]) 


Para evitarnos el tener que cambiar de tipo lo mas sencillo es definir desde el 
principio el arreglo usando reales (bastara usarlo en una unica entrada), es decir 

>>> a=np.array([2.,5,7]) 

>>> a.dtype 
dtype ( ’ float64 ’ ) 


Matrices 


Los arreglos tambien pueden ser multidimensionales; en particular, podemos 
trabajar con matrices como arreglos bidimensionales, definiendoles del siguiente 
modo: 


>>> M=np 

array ( [ [1 

,3,5] ,[2,1,8]]) 

>>> M 



array ( [ [ 

1. , 3. , 

5.] , 

[ 

2. , 1. , 

8.]]) 


y podemos acceder a sus elementos con un doble fndice, tal y como hanamos 
con una matriz (recordando que los indices comienzan en 0): 

>>> M [0,2] 

5.0 


Si bien trabajar con los arreglos multidimensionales es sencillo, NumPy 
incorpora un tipo especial de dato para trabajar con matrices, que sera el que 
usemos en todo este texto, por estar especialmente disenado para el algebra 
lineal. Las matrices se pueden definir de varias formas, aqui mostramos algunos 
ejemplos: 


>>> 

a = np.array ( [ [1,2. ,3] , 

[2,5,2]]) 

>>> 

A=np.matrix(a) 


>>> 

B = np.matrix([ [1 ,0 . ,1] 

rs 

1-1 

1-1 

rH 

1 

o 

CM 

i_i 

>>> 

C=np.matrix(’1 3 6.; 

0 1 1 ’ ) 


Observese que la matriz A se ha construido a partir de un arreglo bidimensional, 
la matriz B se ha obtenido usando el mismo tipo de definition que los arreglos, 
mientras que C se ha construido de forma mas sencilla, como una especie de 
lista, separando los elementos de cada fila por espacios y los de cada columna 
por ;. En el tema 2 tratamos las diversas operaciones y metodos existentes para 
las matrices. 
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aam El modulo SymPy 

El calculo numerico con un ordenador llcva aparejado ciertos inconvenientes 
debido a la imposibilidad de almacenar un numero infinito de cifras decimales. 
Asf, el numero | no puede almacenarse mas que a traves de una aproximacion 
numerica con un numero finito de cifras decimales. Este hecho da lugar a los 
denominados errores de redondeo que tratamos en el tema 3. Los programas 
para el calculo simbolico permiten que los ordenadores puedan trabajar, no con 
aproximaciones numericas, sino con el numero exacto, al igual que podemos 
hacer nosotros “a mano”. El lector quizas se pregunte que, si esto es posible, 
por que los ordenadores no trabajan siempre con calculo simbolico. La respuesta 
es que el calculo simbolico es rnucho mas lento que el calculo numerico y no es 
posible trabajar con un numero grande de datos. 

SymPy es una librerfa de calculo simbolico que no solo nos permitira hacer 
calculos de forma exacta, sino trabajar tambien con expresiones simbolicas, es 
decir, “con letras”, como podemos hacer nosotros. Por ejemplo, 

>>> import sympy as sp 
>>> x,y=sp.symbols(’x y’) 

>>> a=(x+y)**2 
>>> sp.simplify(a) 

2*x*y + x**2 + y**2 


Hemos definido dos variables simbolicas x e y mediante la funcion symbols, 
de modo que la expresion (x + y ) 2 ahora toma pleno sentido. Con la funcion 
simplify obtenemos dicha expresion simplificada. Este modulo tambien posee 
una forma de definir matrices simbolicas, aunque las formas cambian: 


>>> 

A = sp.Matrix([[1,x] 

[y »i] ]) 

>>> 

B=sp.Matrix(2,3,[1,2 

x,0,1,y]) 

>>> 

B 


[1, 

2 , x] 


[0, 

i. y] 



y posibilita el calculo exacto del siguiente modo: 


>>> a=sp.Rational(1,2) 
>>> b=sp.Rational(2,3) 
>>> a+b 
7/6 


A lo largo de los diferentes temas irernos viendo algunas de las capacidades 
de este modulo. 
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C Soluciones a los ejercicios de repaso 


\ y 


ID - 

NUMEROS COMPLEJOS 


1.1 

4 — 7ij 2 — 1 ~ z 5 2; 1 -|- ITzj 2; 

-45 + 17i; 



13 . 11 7 *. _23 _ 41 _1 , 2 - 

29 ' 2934 34 ^ 5 ' 5 6 ’ 

—2 — 5i; -§+«; 

4 + i 

1.2 

—i; 3 + 2z; 7r + e + z; e — 7r; 

i\ -1 — |* 


1.3 

2 , tt; 1 , -f; 5^2, -f; 6 , f 

; 2 , -f; 2 v^, 
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4 

1.4 





2 = 2(cos7r + isen7r); — i = e _I 5 = cos(—f) + isen(— 
5 — 5 i = 5y/2e~ 1 ^ = 5y/2 (cos(— |) + *sen(—^)) 

—3-^ + 3? = 6eT = 6 (cos(^) + isen(^)) 

— 1 — y/Zi = 2e _ ^f = 2 (cos(—+ isen(—^)) 
- 2-2 * = 2 v / 2e _i T L = 2\/2 (cos(-^t) + isen(-^t)) 


1.5 

1.6 
1.7 


-l; ¥ + ¥*; -v/2-^; # + -§ 

i: 16 + 16 yfZi\ 4096; -± + 


</2, -</2, </2i, -^2i; + K # + k -k 


+3 

2 


2 


VI 

2 


_ i» _Va 
2 l '> 2 


1 7 _ V3 

22 


- 

2 L "> 




2 


1.8 


0, -i - -1 + 2t, -1 - 2i; 

3, y/5i, —y/5i; —1, — | + Vpi, — \ — 
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Bl - 

MATRICES Y DETERM I NANTES 


2.1 

(a) 


Ri 


24500 

19000 

11200 ^ 

1 /21250 

22400 

14750 

11500 

7000 

i?2 = 




i 

1 V16125 

17200 

5125 

4000 

2450 / 

\ 



(b) (R 2 )22 = 17200; (i?i) 33 = 24 50 

(c) (i? 2 )n 

(d) (i?i)n + (i?i) 22 + (7 ?i) 33 = (i? 2 )n + (i? 2 ) 22 = 38 4 50 


2.2 

2.3 



1 — 2* 2 + 3* 5 + 5* 

7 + * —3* 3 + 2* 

7 10-4* -3 - 3* 


11 - 3* 
2 + 3* 


27 — 12* -2 
10 + 8* 7 


— 10 + 2* —12 +12* 2 + 9* 



5 + 8* —6 — 5* 1 — 10* 

— 14 — 4* 1 + 5* —7 + * 

-15+ * -25 + 10* -1 + 7* 

-1 2-2 i -10-10i 

9 + 2* -2 + 3* 15 + 2* 

12 — 9* -2-2* 26 + 11* 


13 + 3* 29 + 2* 2 + 2* 

2 + 5* 2 + 10* -7-2 * 

— 10 + 4* —16 — 2* -2-9* 



2.4 
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2.6 

(a) £7 32 (1)^7 3 ( 1)^23(—1 )£?i 3 (—3)^12(—2) 

(b) £^2! (—2)^31 (—3)^732 (1)^41 (—2)^742 (—2)^43 (— 2)^4 (— 1)^3 ( 5 ) 
•^4(-2)^ 3 (-2)Si 4 (-1)Si 3 (2)£;i 2 (-1) 

2.7 (a) 3 (b) 4 

2.8 

(a) F 2 — Fi , F4 — F 3 => dos bias iguales 

(b) F 2 — Fi, F 3 — F 2 , F4 — F 3 y al resultado F 3 — F 2 , F4 — F 3 => dos bias 
iguales 
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SISTEMAS DE ECUACIONES LINEALES 

3.1 (a) Xi = 3, X 2 = 2, X 3 = 1 (b) No tiene solution 

3.2 (a) x = 3, y = 1, z = 1 (b) x = 1, y = 2, 2 = — 2 

3.3 rango(ti) = 3 

3.4 

(a) xi = 3 — 2a; 3 - x 5 , x 2 = — | + 3a; 3 - |a :4 + 2x 5 

(b) No tiene solution 

(c) X\ = —3 + 3a; 3 , x 2 = 2 - x 3 

(d) xi = 5 — X 3 + Xi, x 2 = 2 — X 3 — Xi 


3.5 

(a) e„ = 0.1; e r = 0.02 = 2% 

(b) e a = 0.000015; e r = 0.000021287 = 0.0021 % 


3.6 Solution exacta: x = y = — -y, 2 : = —5. 

Gauss sin pivoteo: a; = 2.598, y = —3.797, 2 = —5. e a = 0.036, e r = 0.0052 = 
0.59%. 

Gauss con pivoteo partial: x = 2.585, x = —3.782, 2 = —4.979. e a = 0.0314, 
e r = 0.0046 = 0.46%. 


3.7 



0 0 o\ 

1 0 0 \ 

2 1 0 / 

0 - 11 / 



0 0 1 

\0 0 0 






(b) L = 
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(c) PA descompone en L = 


(° 1 
con P = I 1 0 

yo 0 





yo 0 


3.8 Solution exacta: x\ « 1203.84615, x 3 ~ —1153.84615. 
Solution aproximada: X\ = 1450, x 3 = —1500. e Q = 424,7519, e r 
25%. 


3.9 

(a) 


(b) 


3.10 

(a) 


(b) 


4 1} = 0.3333, 4 1} = 0.0, 4 1} = 0.5714 
xf ] = 0.1428, 4 2) = -0.3571, x {2) = 0.4285 
4 3) = 0.0714, 4 3) = -0.2142, 4 3) = 0.6632 

4 1} = 0.9, 4 1} = 0.7, 4 1} = 0.6 

x[ 2) = 0.97, 4 2) = 0-91, 4 2) = 0.74 
4 3) = 0.991, x ( 2 3) = 0.945, 4 3) = 0.782 


4 1} = 0.3333, 4 ]) = -0.1666, x ( 3 1} = 0.5 

4 2) = 0.1111, 4 2) = -0.2222 , 4 2) = 0.6190 

4 3) = 0.0529, 4 3) = -0.2328, 4 3) = 0.6485 

x^ = 0.9, 4 1} = 0.79, 4 1} = 0.758 

4 2) = 0.979, 4 2) = 0.9495, = 0.7899 

4 3) = 0.9949, 4 3) = 0.9574, x^ 3) = 0.7914 


= 0.2547 = 
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ESPACIOS VECTORIALES 

4.1 

(a) Independientes 

(b) Dependientes: (1,2,3) — (1,3,2) — (0, —1,1) 

(c) Dependientes: 0 • (1, 0,1,0) + (2,1, 3,1) + (0,1,1,1) - (2, 2,4,2) 

4.2 (a) 3 (b) 2 (c) 2 

4.3 (a) Independientes (b) Independientes (c) Dependientes 

4.4 (a) Forman base (b) Forman base (c) No forman base 


4.5 


(a) rango(^4) = 2 y rango(C) = 3, luego contiene una base 

(b) B = {(1,5,1), (2,1,0), (1,0,0)} 

4.6 Como rango(S') = 3, es sistema generador. Si = {a: + 1, x — 1, x 2 — 1} 

4.7 

(a) rango(£>') = 3 

(b) (3,-5,7) B ' 



4.8 (a) Si (b) No (c) Si (d) Si 

4.9 No 

4.10 Si 

4.11 

(a) Dimension: 2; base: {(—1,3, 2, 0), (1,0, 0,1)} 

(b) Dimension: 2; base: {(—1,1,0, 0), (7,0, — 3,1)} 

(c) Dimension: 2; base: {(—1, —1,1, 0), (1, —1,0,1)} 


4.12 
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BB - 

APLICACIONES LINEALES 

5.1 Todas son lineales. 

5.2 



(c) (3 -1 l) 
5.3 Base de 


f f 1 

o\ 

( 0 

l\ 

( 0 

o\ 

( 0 

°\ 

( 0 

o\ 

( 0 

°\ ) 

0 

0 

, 0 

o 

’ 1 

0 . 

’ 0 

1 

, 0 

o 

’ 0 

0 , 

[ \° 

0 J 

\° 

0 J 

\° 

0 J 

\° 

0 J 

Vi 

0 J 

\° 

1 / j 


Matriz de la aplicacion traza: T = (1 0 0 1 0 0 ) 




0 0-1 


5.4 T = 

5.5 

(a) 


0-10 
1 0 01 

0 0 1 



26 7\ M . 7 27' 

-1 1 </ + /) ° 9 1 - 2 , 


5-1 7 

<?° (/ + /')-> I 7 1 14 

9 3 21 





</° (/ + /')-> 
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(3 + 9') 0 (/ + /') 


12 

0 

21 

13 

-1 

21 

12 

0 

21 


(/ + /') 0 (3 + 3') 


/33 34\ 

V° -V 


(b) (f + /') o g: Biyectiva; ( f + f')o q'\ Biyectiva; f o (q + o’): Biyectiva; 
3°(/+/') : Nada; g'o(/+/') : Nada; (g+g') 0 /’: Nada; (3+3')°(/+/') : 
Nada; (/ + /') o (g + g'): Biyectiva. 


5.6 La matriz de / es A 
que AB = I. 


y la de g es B 



^ . Basta ver 


5.7 Es invertible porque det(T) ^ 0. T 1 



5.8 


5.9 

5.10 



/ 4 0 

V° 1 



(a) Base de ker(^4) = {(—1, 0,1)}. Im(^4) : {x + y — z = 0 
A no es ni inyectiva ni sobreyectiva. 

(b) ker(B) = {0}, Im(H) = C 2 . B es inyectiva y sobreyectiva. 


(c) Base de ker(D) = {(2 i, —2,1)}. Im(D) : {—ix + z = 0 
D no es ni inyectiva ni sobreyectiva. 
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BQ - 

DIAGONALIZACION 

6.1 

(a) p( A) = A 2 + A — 2; Autovalores: —2, 1. 

(b) p( A) = A 2 — 6A + 9; Autovalores: 3 (doble). 

(c) p{ A) = —A 3 + 6A 2 — 11A + 6; Autovalores: 1, 2, 3. 

(d) p{ A) = —A 3 — A 2 + A + 1; Autovalores: —1 (doble), 1. 

(e) p{ A) = —A 3 — 10A 2 — 32A — 32; Autovalores: —4 (doble), —2. 

(f) p( A) = —A 3 + A 2 ; Autovalores: 0 (doble), 1. 

(g) p(A) = A 4 — 2A 3 + A 2 ; Autovalores 0 (doble), 1 (doble). 

(h) p{ A) = A 4 — 4A 3 + 3A 2 + 4A — 4; Autovalores 2 (doble), —1,1. 

6.2 

(a) {(-2,1), (-1,1)}. 

(b) No hay base de autovectores. 

(c) {(1,-2,2), (1,-3,3), (-1,0,1)}. 

(d) No hay base de autovectores. 

(e) {(1,2,0),(1,0,6),(2,3,1)} 

(f) No hay base de autovectores. 

(g) No hay base de autovectores. 

(h) No hay base de autovectores. 


6.3 





(b) No es diagonalizable en R 3 . 


/2 0 
(c) D= I 0 3 

yo 0 
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(d) 

(e) 

6.4 

(a) 


(b) 


(c) 


(d) 

6.5 

(a) 


(b) 


(c) 



No es diagonalizable en R 3 . 


J = 


J = 


J = 


J = 





Autovalores: 0 y 2 — Autovectores: (1 + *, —1) y (*, 1). Matrices de paso: 


1 + i 
-1 


No hay matriz de paso real. 


Autovalores: 1 — 3* y 1 + 3*; Autovectores: (—*,3) y (*, 3). Matrices de paso 
compleja y real: 



* y —* (dobles); Autovectores: (— i, 0,1, 0), (*, —i, 0,1), (*, 0,1, 0), (—*, *, 0,1). 
Matrices de paso compleja y real: 
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6.6 



0 

1 

0 
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Apendice C ■ Soluciones a los ejercicios de repaso 


SB - 

ECUACIONES LINEALES EN DIFERENCIAS 

7.1 

(a) Xk = l2 k + l(-l) k 

(b) x k = 2 fe_1 

(c) x k = Ci3 fc + C 2 k3 k + c 3 (-l) fe 

(d) x k = Ci cos (fc|) + C 2 sen (fcf) + c 3 fc cos ) + C 4 sen (A:|) 


7.2 u n = 6 ", = 6 " 





C.8 ■ Espacio vectorial euclideo 
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BB - 

ESPACIO VECTORIAL EUCLIDEO 


3 2 l\ 

2 2 1 

1 1 V 

8.2 {( 1 , 0 , 0 ), ( 0 , — 2 , 0 ), ( 0 , 0 , 5 )} 

8.3 {(-2,1,0), (-3, -6,5)} 

8.4 

(a) No 

(b) Si 

(c) No 



8.5 {—5a; 3 + 3a;, — 15a: 2 + 12a; + 9} 

8 6 c = I'-X _A 15 n\ , (J- A 25 19 i\ 

^ l 17’ 17’ 17’ 17’ u / ' V17’ 17’ 17’ 17’ 

8.7 (2,1,1) 

8.8 

(a) {x, x 1 — x} 

(b) (3+l) x 2-(* e +2)x 


8.9 

(a) (1,-1) 

(b) (2,-2,1) 
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BH - 

ESPACIO AFIN 


9.1 Cambio de sistema de referenda: 



Ecuacion de la recta: Ax' + y' — 2 = 0 

9.2 

(a) (x,y,z) = (1,2, — 1) + t(l, — 1,4) 

(b) (x, y, z, t) = (0,1, -1,0) + 1 { 0,1, -1,1) 

(c) (x,y,z) = t{- 1,2,3) 

9.3 Se cruzan. 

9.4 

(a) x — 2y + z = 1 

(b) 5a; — 7y + z = — 3 

(c) —x + 5y + 2z = 0 


9.5 d(P, r) = \/5, d(P, tt) = 

9.6 d(n, r 2 ) = d ((2,1,-1,0), (f, 0, i, 1)) = ^ 

(l 0 0 o\ 


9.7 (a) 


2 

3 

2 

3 

VI 


(c) 


0 

-1 


0 -1 


0 -1 


9.8 


( a ) (3-I--3) 

( b ) (l.-I.-f) 

(c) 


(b) 


/l 

0 

0 

V° 


0 o\ 

2 2 
3 3 

1 2 
3 3 
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Bibliografia 


La mayorfa de libros publicados que tratan sobre algebra lineal incluyen buena 
parte de los contenidos cubiertos en este texto, por lo que ademas de los citados 
aqui [3, 6, 7, 9, 11, 12, 17, 22], el lector puede encontrar material similar en 
muchos otros textos. Por otra parte, internet se ha convertido en una fuente 
inagotable de recursos, tanto de paginas web corno de material sin publicar, que 
esta a disposition de todos gracias al trabajo de personas de todo el rnundo; 
algunos de esos materiales son citados aqui [1, 2, 5, 8, 10, 13, 18, 23], aunque 
son tantas las paginas visitadas durante la elaboration de este texto que a veces 
resulta dificil referenciar todo el material empleado. 
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